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Definitionen 

20 Rekonfigurierbare Elemente werden abhangig von der auszufuhrenden Applikation 
unterschiedlich und applikationsentsprechend ausgestaltet . 



25 



Die Aufgabe der Erfindung besteht darin, Neues far die gewerbliche Anwendung 
berei tzustellen . 

Die Losung der Aufgabe wird unabhangig beansprucht. Bevorzugte 
Ausfuhrungsformen finden sich in den Unteransprttchen. 



Unter einer rekonf igurierbar en Architektur werden vorliegend Bausteine (VPU) 
30 mit konfigurierbarer Funktion und/oder Vernetzung verstanden, insbesondere 
integrierte Bausteine mit einer Mehrzahl von ein- oder mehrdimensional 
angeordneten arithmetischen und/oder logischen und/oder analogen und/oder 
speichernden und/oder intern/extern vernetzenden Baugruppen, die direkt oder 
durch ein Bussystem miteinander verbunden sind. 

35 

Zur Gattung dieser Bausteine zahlen insbesondere systolische Arrays, 
neuronale Netze, Mehrprozessor Systeme, Prozessoren mit mehreren Rechenwerken 
und/oder logischen Zellen und/oder kommunikativen/peripheren Zellen (10), 
Vernetzungs- und Netzwerkbausteine wie z.B. Crossbar-Schalter, ebenso wie 
40 bekannte Bausteine der Gattung FPGA, DPGA, Chameleon, XPUTER, etc.. 

Hingewiesen wird insbesondere in dies em Zusammenhang auf die folgenden 
Schutzrechte und Anmeldungen desselben Anmelders : 

P 44 16 881.0-53, DE 197 81 412.3, DE 197 81 483.2, DE 196 54 846.2-53, 
DE 196 54 593.5-53, DE * 197 04 044.6-53, DE 198 80 129.7, DE 198 61 088.2-53, 
45 DE 199 80 312.9, PCT/DE 00/01869, DE 100 36 627.9-33, DE 100 28 397.7, 

DE 101 10 530.4, DE 101 11 014.6, PCT/EP 00/10516, EP 01 102 674.7, DE 196 51 
075.9-53 , DE 196 54 846.2-53, DE 196 54 593.5-53 , DE 197 04 728.9, DE 198 

1 
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07 872.2 , DE 101 39 170.6 , DE 199 26 538.0 , DE 101 42 904.5 , , DE 102 06 

653.1 , DE 102 06 857.7 , DE 100 28 397.7 , DE 101 10 530.4 , DE 102 02 

044.2 , DE 101 29 237.6-53 , DE 101 42 904.5 , DE 100 50 442.6 , DE 101 35 
210.7-53 , EP 02 001 331.4 , 60/317,876 . Diese sind hiermit zu 

5 Of fenbarungszwecken vollumfanglich eingegliedert . 

Die o.g. Architektur wird beispielhaft zur Verdeutli cluing herangezogen und im 
folgenden VPU genannt. Die Architektur besteht aus beliebigen arithmetischen, 
logischen {auch Speicher) und/oder Speicherzellen und/oder Vernetzungszellen 

10 und/oder kommunikativen/peripheren (IO) Zellen (PAEs), die zu einer ein- oder 
mehrdimensionalen Matrix (PA) angeordnet sein kGnnen, wobei die Matrix 
unterschiedliche, beliebig ausgestaltete Zellen aufweisen kann; auch die 
Bussysteme werden dabei als Zellen verstanden. Der Matrix als ganzes oder 
Teilen davon zugeordnet ist eine Konf igurat ions einheit (CT, Ladelogik) , die 

15 die Vernetzung und Funktion des PA konf iguriert . Die CT kann z. B. als 

dedizierte Einheit gem. PACT05 , PACT10, PACT17, ausgestaltet sein oder als 
Host-Mikroprozessor nach P 44 16 881.0-53 , DE 102 06 856.9 dem PA 
zugeordnet bzw. mit oder durch solche realisiert sein. 

20 

Stand der Technik 

Unterschiedliche PAE-Strukturen sind nach dem Stand der Technik bekannt. Die 
gebrauchlichsten sind durch DE 196 51 075.9-53 , DE 100 50 -442.6 , sowie 
25 Chameleon CS2112 definiert. Weiterhin soli auf die bekannten FPGA-Zellen 
verwiesen werden. 

Aus dem universitaren Umf eld sind Zellstrukturen wie die DPGAs , RawMachine 
(DeHuon) , KressArrays (Kress, Uni Kaiserslautern) , XPUTER (Hartenstein, Uni 
30 Kaiserslautern), sowie weitere Strukturen bekannt. 

Die nachfolgend beschriebenen Erweiterungen, die fur alle vorgenannten 
Strukturen nutzbar sind, verbessern die Nutzbarkeit der Architekturen und 
PAE-Strukturen in komplexen insbesondere auch stark sequentiellen und/oder 
35 wenig datenf lufiorientierten Anwendungen. Weiterhin wird der AnschluS an 
externe Einheiten (z.B. Speicher und/oder Peripherie) vereinfacht und 
homogenisiert . 

40 

Indirekte Konf iguration 

In einer besonderen Ausfuhrung einer PAE (IPAE) wird diese oder eine Gruppe 
von PAEs mit einem Speicher (REAM), vorzugsweise einer RAM- PAE gekoppelt. Die 
IPAE weist einen eigenen internen Sequenzer auf oder ist mit einem Sequenzer 
45 bzw. Microcontroller mit einem bevorzugt limitierten, d.h. mit einer 

vergleichsweise geringen Anzahl an unterschiedlichen mdglichen Befehlen, 
ahnlich wie bei RlSC-Prozessozren und/oder bevorzugt vollstandigen 

19. 8«t>e«*0»r Jooa ^ 
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Befehlssatz (vgl. ARC Microprocessor) gekoppelt. Mit anderen Worten wird 
bevorzugt ein RISC Prozessor mit einem m6glichst kleinen Befehlssatz, der 
jedoch berechnungstheoretisch vollstandig ist, verwendet. In einer 
Ausf tinning s variant e kann der Sequenzer auch durch eine Konf iguration einer 
5 • Oder mehrerer PAEs gebildet werden. Es kann der Sequenzer in seiner Funktion 
und s einem Abl auf vernal ten konf igurierbar ausgestaltet sein (wie 
beispielsweise nach dem Stand der Technik bekannt, z.B. durch EPS448 von 
Altera [ALTERA Data Book 1993]). Der Sequenzer /Microcontroller kann auf 
Zustande (z.B. Statussignale, Ereignisse) in der IPAE und/oder auf Zustande 

10 (z.B. auch Trigger) anderer PAEs, die mit der IPAE verbunden sind (z.B. uber 
ein Bus sys tern) , reagieren. In einem Register der IPAE wird ein Pointer auf 
einen RRAM Speicherinhalt konf iguriert, z. B. kann der ProgramPointer Rpp 
kann wahrend des Reset-Zyklus auf die Startadresse des Codes gesetzt werden. 
Ein Adressgenerator im Sequenzer liest den durch den Pointer ref erenzierten 

15 Speicherinhalt aus dem RRAM und schreibt diesen (oder einen Teil dessen) 
entweder in ein, beispielsweise durch den Speicherinhalt adressiertes, 
Konf igurationsregister einer adressierten PAE oder nutzt den Speicherinhalt 
als Instruktion far eine nachste Verarbeitung. Der Pointer wird durch den 
Adressgenerator entsprechend der ublichen Arbeitsweise von Adresspo intern 

20 inkrementiert und/oder dekrementiert und/oder bei Sprungbef ehlen (JUMP, CALL, 
RETURN) neu gesetzt. Insoweit stellt der Speicher RRAM einen Code speicher .und 
in einer bevorzugten Ausfuhrung auch Datenspeicher fur einen Sequenzer zur 
Verftigung und/oder wird als solcher genutzt. Der Sequenzer kann frei Code aus 
dem Speicher (RRAM) lesen und in einer bevorzugten Ausfuhrung auch Daten aus 

25 dem Speicher lesen oder in den Speicher schreiben. Insofern stellt der 
Speicher auch einen Datenspeicher fUr den Sequenzer dar. 

Der RRAM Speicherinhalt kann yon einer tibergeordneten Konf igurationseinheit 
(CT) geladen werden. In einer erweiterten Ausfuhrung kann der Speicherinhalt, 
30 ggf . auch von der IPAE selbstandig, zusatzlich oder alternativ aus einem 

anderen (beispielsweise externen) Speicher geladen oder an diesen geschrieben 
werden, z.B. uber einen AnschluS an ein Frontend. 

In einer Aus ftihrungsvari ante kann der Speicher und/oder die IPAE einen 
35 direkten AnschluS (EXTBUS) an ein externes RAM und/oder externe IO besitzen. 

In einer dabei besonders bevorzugten Ausgestaltung kann der EXTBUS uber eine, 

ggf. dedizierte, Verbindung des PAE-Bus sys terns an eine Interf ace-Baugruppe 
(IOAG) wie beispielsweise aus PACT 03 oder PACT 15 bekannt realisiert sein. Die 

Ansteuerung von Speicher (RAM) und/oder Peripherie (10) erfolgt dabei 
40 bevorzugt durch die Interf ace-Baugruppe. 

In einer besonders bevorzugten Ausgestaltung kann der RRAM selbstandig Code 
und/oder Daten fur den Sequenzer tlber den EXTBUS aus dem oder einem externen 
RAM laden. Diese Funktion kann durch eigenstandige, im RRAM implementierte 
45 oder implement ierbare Adr ess genera tor en realisiert werden. Beispielsweise 

eignen sich DMA-Kontroller besonders fur diese Aufgabe, indem sie blockweise 
Daten zwischen den Speichern kopieren. Der Adressraum der zu lesenden Daten 

IS. Cc8t«ato«r 2001 <2 
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und der Zieladressraum wird entsprechend gesetzt und der Kopiervorgang wird 
gestartet. Das Setzen kann durch die IPAE erfolgen. 

In einer hardwaremafiig aufwendigeren Lasung kann die Funktion durch eine 
5 implementierte MemoryManagemenUni t (MMU) realisiert sein, der en allgemeine 

Funktionsweise durch den Stand der Technik per se definiert und bekannt ist. 
Vorliegend arbeitet die bevorzugte MMU hier wie folgt: 

Der von der MMU verwaltete RRAM Speicher 1st in mehrere Seiten (Pages) 
10 aufgeteilt. Jede Page enthalt Daten eines virtuellen Speicherraumes innerhalb 
eines externen Speichers. Beispielsweise kannen die bexadeziraalen RRAM- 
Adressen OxOaOO. . OxOaf f Daten des externen Speichers an den Adressen 
0xbdl3200. .0xbdl32ff enthalten. Zur Verwaltung der Adressumsetzung wird eine 
Adressubersetzungseinheit verwendet, die vorzugsweise durch in der RRAM-Zelle 
15 vorgesehene Lookup-Tabellen realisiert ist. Die MMU ist nun dazu 

vorgesehen, insbesondere einen grofien Speicherraum auf den sehr viel 
Kleineren des RRAM zu ttbersetzen. Dies geschieht vorliegend derart, dass 
Seiten je "nach Bedarf von dem grofien Speicherraum in den Kleinen kopiert 
werden. Sobald eine Seite nicht mehr bendtigt wird, kann diese geiascht 
20 und/oder uberschrieben werden. Wenn die Daten auf der Seite verandert wurden, 
wird die Seite bevorzugt vor dem Loschen/Oberschreiben in den grofien 
Speicherrraum zuruckgeschrieben. 

Die Adressumsetzungseinheit arbeitet dann derart, dass ein hGherwer tiger Teil 
25 der physikalischen Adresse (also die Adresse der Seite) in dem Iiookup- 

Speicher abgelegt wird und auf die entsprechenden Daten der Seite im RRAM 
zeigt, sobald die Seite innerhalb des kleinen Speichers (RRAM) verfttgbar ist- 
Dadurch kann ein Zugriff auf die Seite erfolgen. Fehlt die Seite im RRAM, ist 
auch keine Referenz eingetragen. In diesem Fall muss die Seite erst von 
30 einem grofien (externen) Speicherraum in den RRAM kopiert werden. Hierzu kann 
eine andere, bevorzugt aktuell nicht verwendete Seite gemafi dem vorstehenden 
Ablauf uberschrieben werden. 

Das Kopieren kann dabei automatisiert , also ohne wesentliche Beteiligung 
35 durch den Sequenzer erfolgen, indem von der MMU ein DMA-Kontr oiler 

angesteuert wird. Die erf indungsgemafie MMU des hier offenbarten RRAM ist 
daher mi t einer Ansteuerung fur einen DMA-Kontroller versehen und/oder 
verbindbar. Diesem werden die entsprechenden Seitenadressen im RRAM und 
externen RAM, sowie die Seitengrafie durch die MMU zur Verftigung gestellt, z. 
40 B. indem sie in Register eingetragen werden. 



In einer maglichen und applikationsabhangig ggf . bevorzugten AusfOhrung 
kannen mehrere EXTBUS- Inter face implementiert sein. 

In einer maglichen AusfOhrung ist der RRAM in mehrere Segmente unterteiltv 
die in unterschiedlichen Adressbereichen liegen. Die Segmente kannen 
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beispielsweise fur einige der folgenden Funktionen aufgeteilt sein bzw. 
aufteilbar sein und insbesondere eine GrSSe aufweisen, die. die 
Implementierung aller oder einiger der folgenden Funktionen ermSglicht sowie 
entsprechende Steuerungen, die gegebenenf alls konf igurierbar sind, bevorzugt 
5 aber fest implementiert sind, besitzen: 

Sequenzer-VCode-Speicher, Stack (z.B. fur Regis tersatz) , Datenspeicher, Heap, 
IO-Puffer, Puffer zu extern era RAM bzw. Cache, Lookup -Tabell en, 
Konfigurationen ftir PAEs und /oder Busse, der Regis tersatz der IPAE. 
Je nach Funktion k6nnen dazu folgende Ansteuermechanismen vorgesehen und/oder 
10 konfiguriert sein: 

Sequenzer-/ Code -Speicher: Programmzeiger auf die entsprechenden 
Speicherstellen (Rpp) . 

Stack: Stackzeiger auf die oberste Speichers telle des Stack (Rsp) , 
gegebenenf alls auch ein FramePointer (Rfp) , wie er nach dem Stand der Technik 
15 (z. B. Intel Pentium) per se bekannt ist. 

Konfigurationen fur PAEs und/oder Busse: Hierauf kann ein Zeiger innerhalb 
der CT und/oder - implement ierungsabhangig ein Zeiger innerhalb der 
Konf igurat ions st euerung der PAE zeigen. 

Registersatz der IPAE: Sollte der Registersatz der PAE im Speicher 
20 untergebracht sein, wird dieser direkt durch die PAE bevorzugt 
hardware technisch fest vorgegebenen adressiert. 

Die restlichen Speicherbereiche, wie Datenspeicher, Puffer, Tabellen etc. 
werden typischerweise und bevorzugt durch den Compiler oder Programmierer 
25 aufgebaut. Die Adressierung dieser Bereiche erfolgt durch das auszufuhrende 
Programm und/oder Betriebs system und wird innerhalb des Programmes und/oder 
Betriebssystems, ggf . unter Zuhilfenahme der Registersatzes und der ALU des 
Sequenzers , berechnet . 

30 Der Registersatz der IPAE kann in einer besonderen Ausgestaltung ahnlich dem 
Registersatz von Transputern als Stack organisiert sein. Dadurch kann der 
Registersatz besonders klein und hardware technisch effizient realisiert 
werden (typischerweise reichen 3 Register A, B und C aus). Weiterhin ist aus 
der Transputertechnologie bekannt, dass Compiler effizient mit einem 

35 derartigen hardwaretechnisch kostengtlnstigen Registersatz arbeiten kdnnen. 
Ebenfalls kann der Registersatz optional im RRAM liegen. 

In einer AusfUhrung kann und wird der RRAM als Multi-Port Speicher ausgefilhrt 
sein. Multi-Port Speicher erlauben den ggf. auch gleichzeitigen Schreib- 
40 und/oder Lese-Zugrif f durch mehrere Speicher zugr if f seinheiten auf den 

Speicherinhalt. Speicherzugriff seinheiten kbnnen beispielsweise externe 
und/oder interne Peripherie, Prozessoren, andere PAEs sein. Die Funktion von 
Multi-Port Speichern ist nach dem Stand der Technik ebenfalls bekannt. 

45 In einer besonderen Ausfahrung kann die IPAE mit dem RRAM als lokale und ggf. 
auch globale Konf igurat ionseinheit ahnlich einer CT far PAEs in der Umgebung 
arbeiten oder unter anderem diese Funktion mit erftlllen. Bevorzugt arbeitet 
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die PAE nach dem aus DE 196 54 846.2-53 bekannten Verfahren bei der 
Verwendung als lokal Konf igurationseinheit . Wird die PAE als globale 
Konf igurationseinheit verwendet, oder sind sehr viele lokale PAEs zu 
konf igurieren, wird bevorzugt das Verfahren nach DE 19 6 54 593.5-53 
5 verwendet, das . eine FILMO-Funktionalitat aufweist und daher sehr viele und 
auch voneinander unabhangige Konf igurationen verwalten kann. 
Die IPAE adressiert, z. B. gesteuert durch den Sequenzer/ Microcontroller, 
Konfigurationen im RRAM und konfiguriert diese an PAEs und/oder sicb selbst 
und/oder bestimmt den Ablauf des Sequenzers /Microcontrollers . Bevorzugt 

10 findet bierbei eine Synchronisation mit einer tibergeordneten CT ahnlich der 
bekannte Inter -CT- Pro tokolle (DE 198 07 872.2, DE 100 28 397.7 , DE 199 26 
538.0 ) statt. Die IPAE RRAM Schaltung kann Konf igurat ion ttber eines der 
EXTRAM- Interface selbst laden und/oder Konfigurationen von einer 
ttbergeordneten CT uber das CT Interface anfordern. Die Funktionsweise kann 

15 ahnlich der Rekonf igurationseinheit in DE 196 54 846.2-53 sein. Die 
Konf igurat ions da ten fur die PAEs werden durch die IRAM an die PAEs 
weitergeleitet oder in einer bevorzugten Ausgestaltung direkt von RRAM. Zur 
Aufteilung der Da ten im RRAM an mehrere PAEs kann dabei ein 
Busverteilverfahren ahnlich des in DE 101 10 530.4 beschriebenen SIMD- 

20 Bus systems verwendet werden. 

Mit anderen Wort en ist die prinzipielle Arbeitsweise einer IPAE RRAM 
Verschaltung ahnlich einem Mi croc on tr oiler sy-s tern, des sen Busanbindung 
und/oder des sen Da ten transfer und/oder des sen Programmablauf einem VPU- System 
25 entspricht. 

Es wird insbesondere Schutz far IPAE-RRAM-Verschaltungen beansprucht, bei 
denen die IPAE und das RRAM jeweils als separate Funktionselemente (PAEs) 
eines rekonf igurierbaren Bausteins ausgestaltet sind und typischerweise 
30 beliebige Verschaltungen und Funktionen ausfiihren kbhnen, aber jedoch 

speziell zum Einsatz der erf indungsgemafi beschriebenen Sequenzerstruktur aus 
IPAE und RRAM entsprechend konfiguriert und verwendet werden kSnnen. Die 
Konf iguration erfolgt dabei bevorzugt durch die ubergeordnete 
Konf igurationseinheit CT. 

35 

Ebenfalls wird Schutz beansprucht fur PAEs, die zusatzlich zu ihrem Anschluss 
an die internen Bussysteme des Arrays aus PAEs einen dedizierten Anschluss 
(IO-Channel) an ein Uberregionales Bussystem aufweisen, das insbesondere 
Daten Uber lange Strecken innerhalb des Arrays ttbertragt und/oder 

40 insbesondere direkten AnschluS an die Peripherie aufweist. Der AnschluS an 

die Peripherie kann dabei direkt erfolgen, indem z. B. das Bussystem bereits 
dem peripheren Protokoll entspricht oder Uber entsprechende Protokollwandler 
zur Umsetzung des Protokolls erfolgen. Das dedizierte Bussystem kann dabei 
bereits einem Industriestandard entsprechen, z. B. PCI, RapidIO, Firewire, 

45 USB, Ethernet, RAMBUS, DDR- RAM etc. urn somit einen einfachen und 

unaufwendigen Anschluss der peripheren Gerate zu ermoglichen. Gegebenenf alls 
• kannen auch in zwischengeschalteten lOAGs (vgl. DE 196 54 595.1-53 ) 
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Protokollkonvertierungen derart durchgefuhrt werden, so dass ein internes 
vereinfachtes und ggf. proprietares Busprotokoll auf ein oder mehrere 
komplexere externe Standardprotokolle ttbersetzt werden. 

Es soli besonders darauf hingewiesen werden, dass unter Peripherie auch 
5 Speicher verstanden werden, wie bei den bereits aufgezahlten Busprotokoll en 
verdeutlicht wird, 

Ebenfalls ist erf indungsgemaS besonders relevant, dass PAEs auch mehrere 
Anschlusse an dedizierte Bussysteme aufweisen k6nnen. 

10 

Desweiteren sind anwendungsabhangig auch Architekturen sinnvoll, bei denen 
nur eine Teilmenge der PAEs Anschluss e an ein dediziertes Bus system aufweist, 
oder unterschiedliche PAEs mit einer unterschiedlichen Anzahl von AnschlQssen 
an ggf. auch unterschiedliche dedizierte Bussysteme aufweisen. 

15 

Im folgenden wird eine detaillierte Beschreibung einer Aus fuhrungsvari ante 
der erf indungsgemaSen Kopplung von IPAE und RRAM ausgefuhrt: 

Es wird erf indungsgemaJS bei einem in Funktion und/oder Vernetzung 

20 insbesondere zur Laufzeit ohne StSrung nicht zu rekonf igurierender Elemente 

rekonf igurierbaren Zellelementef eld zur Datenverarbeitung mit Funktionszellen 
zur Ausfuhrung algebraischer und/oder logischer, konf igurierbarer Funktionen 
und Speicherzellen, urn Inf ormationen zu empfangen, abzuspeichern und/oder 
auszugeben vorgeschlagen, daS eine Steuerverbindung (CMD) von den 

25 Funktionszellen zu den Speicherzellen geftlhrt ist. Diese Steuerverbindung 

dient dazu, die Adress- und/oder Datenein/ausgabe aus dem Speicher durch die 
zugeordnete Funktionszelle, ■ typisch einer ALU-PAE, steuerbar zu machen. So 
kann etwa angegeben werden, ob die nachste tlbertragene Information als 
Adresse oder als Da ten behandelt werden soil und ob ein Lese- und/oder 

30 Schreibzugrif f erforderlich ist. Diese Datentibertragung aus der 

Spei cher z ell e, bei der es sich etwa urn eine RAM-PAE handeln kann, auf die 
ALU-PAE erlauben dann, dafi neue, von der ALU abzuarbeitende Befehle in diese 
geladen werden kdnnen. Es ist auf diese Weise maglich, lediglich durch 
Vorsehen einer dedizierten und dediziert funktionszellenkontr oilier ten 

35 Steuerverbindung zwischen Funktionszelle und' Speicherzelle bereits mit nur 
zwei Elementen, die tiber geeignete Busse verbunden sind, eine 
Sequenzerstruktur in einem Zellelementef eld aufzubauen, ohne dafi ansonsten 
weitere Mafinahmen und/oder bauliche Veranderungen erforderlich sind. In der 
Speicherzelle konnen Daten, Adressen, Programmschritte usw. in per se aus 

40 herkemmlichen Prozessoren bekannter Weise abgelegt werden. Weil beide 

Elemente auch in anderer Weise bei entsprechender Konf iguration einsetzbar 
sind, ergibt sich eine besonders effiziente Bauweise, die sowohl 
Sequenzerstruktur en als auch vektoriellen und/oder pa- rallelisierbaren 
Strukturen besonders gut anpafibar ist. 

45 

Es ist einsichtig, daS durch die Verwendung von lediglich zwei Zellen in 
einem Zellelementef eld, namlich der Funktionszelle und der 
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Informationsbereitstellungszelle eine Vielzahl von sequenzerartigen 
Strukturen in dem rekonf igurierbaren Zellelementef eld aufgebaut werden kann. 
Dies ist insofern vorteilhaft, als oftmals bei der Datenverarbeitung, etwa in 
einem multitaskingfahigen Be triebs system, eine Reihe unterschiedlicher und 
5 voneinander per se verschiedener Aufgaben abgearbeitet werden mufi. Es konnen 
dann eine Vielzahl derartiger Aufgaben in einem einzigen Zellelementef eld 
effektiv gleichzeitig abgearbeitet werden. Die Vorteile fur 
Echtzeitanwendungen sind of f ensichtlich. Weiter ist es auch mOglich, die 
einzelnen Seguenzer strukturen, die in einem Zell- elementefeld unter 

10 Vorsehung der erf indungsgemaSen Steuerverbindung aufgebaut werden, mit 

unterschiedlichen Taktraten zu betreiben, etwa urn den Stromverbrauch dadurch 
zu senken, daS Aufgaben mit geringerer Priori tat langsamer abgearbeitet 
werden. Es ist tiberdies m6glich, bei der Ausfuhrung per se weitgehend 
parallel er Algorithmen sequenzerartige Programmteile in dem Feld parallel 

15 Oder vektoriell abzuarbeiten und umgekehrt. 

Das Zellelementefeld mit den in Funktion und/oder Vernetzung konf igurierbaren 
Zellen kann einsichtigerweise einen Prozessor, einen Coprozessor und/oder 
einen Mi kroc on t roller bilden, bzw. eine parallele Vielzahl Oder Kombinationen 
20 derselben. 

Die Funktionszellen sind typisch als arithmetische Logikeinheiten gebildet, 
wobei sie insbesondere grobgranulare Elemente darstellen, die aber mit einer 
f eingranularen Statemachine versehen sein kGnnen. In einem besonders 

25 bevorzugten Ausfuhrungsbei spiel handelt es sich bei den ALUs urn sogenannte 
erweiterte ALUs (EALU) , wie diese in den f rtiheren Anmeldungen des 
vorliegenden Anmelders beschrieben wurden. Eine Erweiterung kann insbesondere 
die Steuerleitungskontrolle, Bef ehlsdekodiereinheit etc. umfassen, soweit 
erforderlich. Es soli darauf hingewiesen werden, dass grundsatzlich zumindest 

30 eine Teilmenge der Funktionszellen auch aus f eingranularen FPGA-Elementen 
aufgebaut sein kann. 

Die Speicherzellen kdnnen Daten und/oder Inf ormationen fltlchtig und/oder 
nichtf luchtig speichern. Wenn in den Speicherzellen abgelegte Inf ormationen, 

35 seien es Programmschritte, Adressen fur einen Zugriff auf Daten oder 

registerartig bzw. heap-artig abgelegte Daten als fluchtige Daten abgelegt 
sind, so kann eine vollstandige Rekonf igurat ion wahrend des Betriebes 
erfolgen. Alternativ ist es maglich, nichtf ltichtige Speicherzellen 
vorzusehen. Die nichtf lttchtigen Speicherzellen konnen etwa als EE-Prom- 

40 Bereich und dergleichen vorgesehen werden, in die ein rudimen tares Bios- 

Programm abgelegt wird, das bei Inbetriebnahme der Anordnung auszuftihren ist. 
Auf diese Weise kann ohne weitere Bauteile eine Inbetriebnahme einer 
Datenverarbeitungseinrichtung erfolgen. Ein nichtf ltlchtiger Datenspeicher 
kann auch dann vorgesehen werden, wenn aus Kosten- und /der Raumgrunden 

45 beschlossen wird, daS immer wieder dieselben programmteile auszuftihren sind, 
wobei dann auch unter solchen f esten Programmteilen, etwa nach Art der WAVE- 
Rekonf iguration, im Betrieb gewechselt werden kann. Die Moglichkeiten, 
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derartige nichtf ltichtige Speicher vorzusehen und zu verwenden, sind 
Gegenstand anderer Schutzrechte des Anmelders. Es ist m5glich, sowohl 
fluchtige als auch nichtf ltichtige Daten in den Speicher zellen abzuspeichem, 
etwa urn ein Bios-Programm fest abzulegen und die Speicherzelle dennoch fur 
5 andere Zwecke nutzen zu kdnnen. 

Die Speicherzelle ist bevorzugt so ausgebildet, dafi sie eine hinreichende ■ 
. vielzahl von zu verarbeitenden Daten und/oder abzuarbeitenden Programmteilen 
speichem kann. Es sei dabei darauf hingewiesen, daS diese Programmteile 
10 sowohl als Programmschritte ausgebildet sein konnen, die jeweils vorgeben, 
was eine einzelne, insbesondere die zugeordnete PAE, also insbesondere die 
die Speicherzelle steuemde Funktionszelle, im nachsten Schritt zu tun hat, 
als auch ganze Konf igurationen fur Feldbereiche oder andere Felder beinhalten 
kann. In einem solchen Fall ist es ohne weiteres moglich, dafi die aufgebaute 
15 Sequenzerstruktur einen Befehl ausgibt, auf Grund dessen eine Rekonf iguration 
von Zellelementefeldbereichen erfolgt. Damit arbeitet die diese Konf iguration 
auslSsende Funktionszelle dann zugleich als Ladelogik (CT) . Es sei darauf 
hingewiesen, dafi die Konf iguration von anderen Zellen wiederum dergestalt 
erfolgen kann, dafi dort eine sequenzerartige Datenverarbeitung erfolgt und es 
20 ist in diesen Feldern wiederum mdglich, andere Zellen im Verlauf der 

Programmarbeitung zu konf igurieren bzw. rekonf igurieren. Damit ergibt sich 
ein iteratives Konf igurieren von Zellelementebereichen und ein Einschachteln 
von Programmen mit Sequenzer- und Parallel-Strukturen, die ahnlich ineinander 
geschachtelt sind wie eine Babuschka. Es sei darauf hingewiesen, dafi hier 
25 insbesondere durch Ein-Ausgabezellen ein Zugriff auf weitere 

Zellelementefelder aufierhalb eines einzelnen integrierten Bausteines erfolgen 
kann, was die Gesamtrechenlei stung massiv erh5hen kann. Es ist insbesondere 
mbglich, bei Auf treten von Konf igurationen in einem Codeteil einer in ein 
Zellelementefeld hineinkonf igurierten Sequenzerstruktur gegebenen falls 
30 entweder die Konf igurationsanf orderungen auf einem zugewiesenen 

Zellelementefeld, das von der jeweiligen Sequenzerstruktur allein verwaltet 
wird, durchzufuhren und/oder es k5nnen derartige Anf orderungen an eine 
Konf igurat ions -Mas tereinheit abgegeben werden, urn sicherzustellen, dafi eine 
gleichmafiige Belegung aller Zellelementefelder erfolgt. Es ergibt sich somit 
35 quasi ein Unterprogrammauf ruf durch Obergabe von erf orderlichen 

Konf igurationen an Zellen oder Ladelogiken. Dies wird fur sich als 
schutzwtirdig angesehen. Es sei auch darauf hingewiesen, dafi die Zellen, 
sofem sie selbst far die Konf iguration anderer Z ell element feldbereiche 
Zustandigkeit besitzen, mit hard- oder sof twareartig implementierten FILMO- 
40 Strukturen und dergleichen zur Sicherstellung einer ordnungsgemafien 

Rekonf iguration versehen sein k6nnen. Auf die M5glichkeit, die Speicherzellen 
wahrend der Abarbeitung von Befehlen derart zu beschreiben, dafi sich der 
abzuarbeitende Code bzw. das abzuarbeitende Programm andert, sei hingewiesen. 
In einer besohders bevorzugten Variante ist diese Art der Selbstmodif ikation 
45 (SM) aber durch eine entsprechende Steuerung tiber die Funktionszelle 
unterdrttckt . 
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Es ist moglich, dafi die Speicherzelle abgespei chert e Information hier auf die 
Ansteuerung der sie steuernden Funktionszelle direkt oder indirekt auf einen 
zur Funktionszelle ftihrenden Bus gibt. Die indirekte Ausgabe kann 
insbesondere dann erfolgen, wenn beide Zellen benachbart liegen und die durch 
5 Ansteuerung angef order te Information an die ALU-PAE tiber ein Bus segment 
eintref fen muS, das nicht unmittelbar mit dem Ausgang der Speicherzelle 
verbunden werden kann. In einem solchen Fall kann die Speicherzelle Daten auf 
dieses Bussystem insbesondere tiber Rtickwartsregister (Backward -Register) 
ausgeben. Es ist daher bevorzugt, wenn zumindest eine von Speicherzelle 

10 und/oder Funktionszelle ein solches Backward-Register aufweist, welches im 
Informationsweg zwischen Speicherzelle und Funktionszelle angeordnet werden 
kann. Diese Register brauchen in einem solchen Fall nicht zwingend mit 
weiteren Funktionalitaten versehen sein, obwohl dies etwa bei Anforderung von 
Daten aus der Speicherzelle far die weitere Verarbeitung, entsprechend einem 

15 herkQmmlichen LOAD-Befehl eines typischen Mikroprozessors, zur Veranderung 
der Daten noch vor dem Hineinladen in die PAE ohne wei teres denkbar -ist, urn 
z. B. einen Befehl LOAD++ zu realisieren. 

Mit anderen Worten werden innerhalb der beschriebenen Struktur 
Busverbindungen bei Bedarf durch die in der XPP-Technologie des Anmelders 

20 typischen Forward (FREG) - und Backward (BREG) -Register geftihrt. Diese besitzen 
die Moglichkeit Daten zwischen horizontalen Bussystemen vertikal zu 
ttbertragen und kSnnen mehrere Busse multiplexen oder demultiplexer Der 
Vollstandigkeit halber sein darauf hingewiesen, dass FREG und BREG (entgegen 
ihrer Namensgebung ) nicht zwangslaufig Registerstuf en darstellen, sondem 

25 lediglich optional und ggf . konf igurierbare Register aufweisen. 

Die Steuerverbindung (CMD) kann dabei an FREG und/oder BREG der jeweiligen 
Funktions zellen (PAEs) gefuhrt werden, um die Bus daten transfers entsprechend 
des aktuell ausgefuhrten Befehls zu steuern. 

30 Die Speicherzelle wird bevorzugt dazu angeordnet sein, Inf ormationen von der 
sie steuernden Funktionszelle zu empfangen, wobei auch weiter ein 
Informationseinspeichern tiber eine Ein-Ausgabezelle und/oder eine die 
Speicherzelle nicht steuernde Zelle moglich ist. Insbesondere dann, wenn 
Daten von einer Ein-Ausgabezelle in die Speicherzelle geschrieben werden 

35 sollen, ist es bevorzugt, wenn auch diese Ein-Ausgabezelle (I/O-PAE) von der 
Funktionszelle gesteuert wird. Dabei kann etwa die Adresse, bei welcher eine 
in die Speicherzelle zu schreibende oder gegebenen falls auch direkt an die 
Funktionszelle (PAE) zu tibertragende Information zu lesen ist, an die I/O-PAE 
von der ALU-PAE ubermittelt werden. Es sei in diesem Zusammenhang darauf 

40 hingewiesen, daS diese Adresse tiber eine AdreStibersetzungstabelle 

(Adresstranslationtable) , einen Adresstranslationbuf f er oder eine MMU-artige 
Struktur in der I/O-PAE festgelegt werden kann. Es ergeben sich insbesondere 
in einem solchen Fall die vollen Funktionalitaten typischer Mikroprozessoren. 

45 Die Funktionszellen-Speicherzellenkombination ist demnach in einer 

bevorzugten Variante zumindest ein Ein-Ausgabe-Mittel zugeordnet, mit welchem 
dann an eine ex t erne Einheit, eine andere Funktionszelle, Funktionszellen- 
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Speicher zellen-Kom-binat ion und/oder Speicherzellen Information gesandt 
und/oder von dieser empfangen werden kann. 

Die Ein-Ausgabe-Einheit wird dabei bevorzugt gleiclifalls zum Empfang von 
5 Steuerbefehlen aus der Funktionszelle ausgebildet* 

Die Funktionszellen-Speicherzellenkorabination weist bevorzugt ■ 
Datentransferm6glichkeiten an die ubrigen Funktionszellen und/oder 
Speicherzellen eines VPU-Bausteines auf , insbesondere solchen, die sich im 
10 Array aus PAEs (PA) befinden. Hierzu werden Zugrif f sm6glichkeiten ttber die 

Bussysteme auf die entsprechenden Zellen zur Verfttgung gestellt, Der Zugrif f 
erfolgt bevorzugt uber die Forward- und/oder Backward-Register der PAEs der 
Funktionszellen-Speicherzellenkombination, durch die ttbertragung der "Port"- 
Steuerkoinmandos . 



OPCODE FETCH, 

INTERNE / EXTERNE DATENZUGRIFFE, 

POSITIONIERUNG VON INTERNEN/ EXTERNEN ADRESS POINT ERN, 
POSITIONIERUNG VON INTERNEN/ EXTERNEN PROGRAMMPO INTERN, 
25 PROGRAMMPOINTER INCREMENT, 

POSITIONIERUNG VON INTERNEN/ EXTERNEN STACKPO INTERN, 
STACKZUGRIFFE (PUSH, POP) 

Beispielsweise kann diese Funktionalitat durch folgende CMD Steuerkonunandos 
30 implementiert werden: 

load — const: Lade eine Konstante in ein Register 

write_Rap: Setze Adress Pointer fur Speicher zugrif fe 



15 



In einer bevorzugten Variante ist die Steuerverbindung (CMD) dazu 
ausgebildet, zumindest einige und bevorzugt alle der nachfolgenden 
Steuerkommandos zu tibertragen: 



20 



40 



35 



45 



write&decr_Rsp : 



write_Reg: 



read_Reg : 



read_Rap : 



read&incr__Rsp : 



set_Rpp : 
set&push___Rpp : 



(z. B. Heap) 

Lese Adress Pointer far Speicher zugrif f e 
(z. B. Heap) 

Lese ein Register aus dem Speicher (wenn Register in der 
RAM-PAE implementiert sind) 

Schreibe Daten in ein Register im Speicher (wenn Register 
in der RAM-PAE implementiert sind) 

Schreibe ein Datenwort auf den Stack und dekrementiert 
den Stackpo inter 

Lese ein Datenwort vom Stack und inkrementeiere den • 

Stackpointer 

Setze Programmpo inter 

Schreibe Programmpointer auf Stack und setze 
Programmpo inter neu 
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Die Steuerkommandos dienen der Steuerung der angeschlossenen Speicherzellen 
und Funktionszellen (PAEs) . Weiterhin steuem die Steuerkommandos den 
Datentransfer auf den Bussystemen, beispielsweise durch Ansteuerung von 
Multiplexers Switches, Transmission Gates, o. S. in den Forward- und 
5 Backward-Regis tern (FREG/BREG) . Weitere Befehle sind z. B. : 

read_Port: Lese Daten von einem Port (beispielsweise implementiert 

durch ein FREG) zum Array 
write„Port: Schreibe Daten auf einen Port (beispielsweise 

implementiert durch ein BREG) zum Array 

10 

Dies kann durch eine entsprechende Bitbreite der Steuerleitung und eine 
zugeordnete Decodierung bei den Empfangern erfolgen. Die jeweils 
erforderlichen Steuer- und Dekodiermittel kOnnen problemfrei und 
kostengunstig vorgesehen werden. Wie ersichtlich, ergibt sich mit den 
15 Signalen eine praktisch vollstandige Sequenzerf ahigkeit der Anordnung. DaS 
auf diese Weise eine Allgemeinzweckprozessordatenverarbeitungseinheit 
erhalten wird, sei erw&hnt. 

Die Anordnung wird typisch so gewSLhlt sein, dafi die Funktionszelle als 
20 alleiniger Master auf die Steuerverbindung und/oder ein als Steuerverbindung 
dienendes Bussegment bzw. Bussystem zugreifen kann. Es ergibt sich somit eine 
Anordnung, bei der die Steuerleitung als Command-Lei tung wirkt, wie sie in 
herkommlichen Prozessoren vorgesehen ist. 

25 Die Funktionszelle und die Speicherzelle bzw. I/O-Zelle sind bevorzugt 

benachbart angeordnet. Unter benachbart kann dabei wie bevorzugt verstanden 
werden, da£ die Zellen unmittelbar nebeneinander angeordnet sind. Alternativ 
befinden sie sich zumindest dicht beieinander. Die Anordnung der Funktions- 
und Speicherzellen in Nachbarschaf t zueinander sorgt dafur, daS keine, 

30 jedenfalls keine signif ikanten Latenzzeiten zwischen Ansteuerung und 

Dateneingang der angef order ten Information in der Funktionszelle auf treten, 
nur weil die Verbindungen zwischen den Zellen zu lang sind. Dies sei als 
„direkt w verstanden. Mtlssen Latenzzeiten bertlcksichtigt werden, so kann auch 
ein Pipelining in den Seguenzerstrukturen vorgesehen werden. Dies wird 

35 besonders wichtig bei sehr hoch getakteten Anordnungen. Es sei darauf 

hingewiesen, daS es ohne wei teres mSglich ist, entsprechend hochfrequent 
getaktete Zelleinheiten vorzusehen, die wie im Stand der Technik per se 
bekannt, auch entsprechend schnell auf geeignete Speicherzellen zugreifen 
konnen. Auch in einem solchen Fall, etwa wenn per se bekannte 

40 Architekturelemente fur die Funkt ions zellen verwendet werden, wird 

gleichzeitig eine Rekonf igurierbarkeit des Funktionszellenelementes und der 
zugeh5rigen Vemetzungen vorzusehen sein. In einer besonders bevorzugten 
Variante sind die Funktions zellen, die Inf ormationsbereitstellungs zellen wie 
Speicherzellen, I/O-Zellen und dergleichen multidimensional angeordnet, 

45 insbesondere nach Art einer Matrix bzw. auf Gitterpunkten eines 

eindimensionalen Gitters usw. Wenn eine regelmaSige Struktur vorliegt, wie 
dies dort der Fall ist, wird einer Zelle typisch aus einer erst en Reihe 
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Information, das hei£t Operanden, Konf igurationen, Triggersignale usw. 
zugefuhrt, wahrend in einer darunterliegende Reihe Daten, Triggersignale und 
andere Inf ormationen abgegeben werden. In einem solchen Fall wird es 
bevorzugt sein, wenn die Zellen in ein und derselben Reihe liegen und es kann 
5 dann der Inf ormat ions transfer aus der Inf ormationsbereitst el lungs zelle in den 
erforderlichen Eingang der Funk t ions zelle uber ein Backward-Register 
erfolgen. Die Mdglichkeit , die Register fur Pipelining zu benutzen, sei 
erwahnt . 

10 Es wird we iter Schutz beansprucht fur ein Verfahren zum Betrieb eines 

Zellelementef eldes, insbesondere multidimensionalen Zellelementef eldes mit 
Funk t ions zellen zur Ausfiihrung algebraischer und/oder logischer Funktionen 
und Informationsbereitstellungszellen, insbesondere Speicherzellen und/oder 
Ein- Aus gabe zellen zum Empfangen und/oder Ausgeben von Inf ormationen und/oder 

15 Speichern derselben, wobei zumindest eine der Funktionszellen Steuerbef ehle 
an zumindest eine Inf ormationsbereitstellungszelle ausgibt, dort im 
Ansprechen auf die Steuerbef ehle Information ftir die Funkt ions zelle 
bereitgestellt wird und die Funktionszelle dazu ausgebildet ist, die weitere 
Datenverarbeitung im Ansprechen auf die bereitgestellte Information 

20 durchzuftthren, um so sequenzerartig Daten zu verarbeiten. 

Es wird also in einem rekonf igurierbaren Feld durch die Ausgabe der 
Steuerbef ehle an die Speicher zelle einer Sequenzerstruktur eine 
sequenzerartige Datenverarbeitung ermaglicht. Die Befehle, die als 
25 Steuerbef ehle von der Funktionszelle ausgegeben werden konnen, ermdglichen 
dabei einen sequenzerartigen Betrieb, wie er aus herkommlichen Prozessoren 
bekannt ist. Es sei darauf hingewiesen, dafi es ohne we i teres mGglich ist, nur 
Teile der genannten Befehle zu implementieren und dennoch eine vollstandig 
sequenzerartige Datenverarbeitung zu gewahrleisten. 

30 

Die vorstehende Ausfuhrungsvariante wird im folgenden noch einmal und 
beispielsweise anhand der Zeichnungen beschrieben. In dieser ist gezeigt 
durch : 



35 Fig. 1 ein erf indungsgemaSes Zellelementef eld, 

Fig. 2a ein Detail hiervon, 

Fig. 2b, c das Detail von Fig. 2a wahrend verschiedener 

Da t enverarbe i tungs z ei ten , 
Fig. 3a eine alternative Aus fuhrungs form des Details 

40 von Fig. 2, 

Fig. 3b eine besonders bevorzugte Variante des 

Details. 

Fig. 4 Grundaufbau einer Funktions-/ Speicher zelle 

(PAE) 

45 Fig. 5 eine Ausgestal tungs variante von Fig. 3b 
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Nach Fig. l(a/b) umfaSt ein allgemein mit 0101 bezeichnetes Zellelementef eld 
zur Datenverarbeitung 0101 Funktionszellen 0102 zur Ausftthrung von 
arithmetischen und/oder logischen Funktionen sowie Speicherzellen 0103, um 
Informationen zu empfangen, abzuspeichern und/oder auszugeben, wobei eine 
5 Steuerverbindung 0104 von Funktionszellen 0102 zu den Speicherzellen 0103 
geftihrt ist. 

Zunachst wird die Arbeitsweise von Fig. la beschrieben. Fig. lb stellt eine 
bevorzugte Ausgestaltung und Anordung der Funktionszellen und Speicherzellen 
10 dar. 

Das Zellelementef eld 0101 ist in der Vernetzung der Elemente 0102, 0103, 0104 
frei konfigurierbar, und zwar ohne den laufenden Betrieb nicht neu zu 
konfigurierender Zellelementeteile zu stSren. Dabei kannen die Verbindungen 
konfiguriert werden, indem Bussysteme 0105 wie erforderlich geschaltet 

15 werden. Weiter sind die Funktionszellen 0102 in ihrer jeweiligen Funktion 
konfigurierbar. Bei den Funktionszellen handelt es sich um arithmetische 
Logikeinheiten, die um bestimmte, Rekonf iguration ermSglichende Schaltkreise 
erweitert sind, wie Statemachines , Schnittstellenbeschaltung zur 
Kommunikation mit der bevorzugt aufierhalb des Zellelementef eldes angeordneten 

20 Ladelogik 0106 usw. Auf die entsprechenden Voranmeldungen des Anmelders wird 
hingewiesen. 

Die Zellelemente 0102,. 0103 des Zellelementef eldes 1 sind zweidimensional in 
Reihen und Spalten angeordnet, wobei jeweils eine Speicherzelle 0103 

25 unmittelbar neben einer Funktionszelle 0102 liegt und bier je Reihe drei 

Speicherzellen-Funktionszellen-Paare vorliegen, in denen die Funktions- und 
Speicherzellen jeweils uber Steuerverbindungen 0104 miteinander verbunden 
sind. Die Funktions- und Speicherzellen 0102, 0103 weisen Eingange auf, die 
mit dem Bussystem oberhalb der Reihe, in der sich die jeweiligen Zellelemente 

30 verbindbar sind, um Daten davon zu empfangen. Weiter weisen die Zellen 0102, 
0103 Ausgange auf, die auf das Bussystem 0105 unterhalb der Reihe Daten 
. ausgeben. Wie noch eriautert werden wird, ist Uberdies jede Speicherzelle 
0103 mit einem Rttckwartsregister (BW) versehen, durch welches Daten von dem 
Bus unterhalb einer Reihe auf den Bus oberhalb der jeweiligen Reihe 

35 durchgeschleust werden k6nnen. 

Mit Ausnahme der Steuerverbindungen 0104 und der zugeordneten Schaltungen 
innerhalb der Funktionszellen {ALU in Fig. 2) bzw. Speicherzellen (RAM in 
Fig. 2) handelt es sich bei dem Zellelementef eld zur Datenverarbeitung von 

40 Fig. 1 um ein herkOmmliches Zellelementef eld, wie es bei rekonf igurierbar en 
Datenverarbeitunsanordnungen, beispielsweise einer VPU entsprechend der XPP- 
Technologie des Anmelders gebrauchlich und bekannt ist. Insbesondere kann das 
Zellelementef eld von Fig. 1 wie bekannt betrieben werden, weist also 
entsprechende Beschaltungen zur Wave -Rekonf iguration, zum Debugging, 

45 Ubertragen von Triggersignalen etc. auf. 
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Die Besonderheiten des Zellelementef eldes der vorliegeriden Erfindung ergeben 
sich aus der Steuerverbindung 0104 und der zugehorigen Beschaltung, die 
nachfolgend naher beschrieben werden wird mit Bezug auf die Fig. 2a-c. Es sei 
dabei erwahnt, dafi, wahrend in Fig. 1 eine Steuerverbindung 0104 stets von 
5 einem weiter links liegende Funktionszellenelement zu einer weiter rechts 

liegenden Speicherzelle gefuhrt ist, und zwar nur und genau zu einer solchen 
Speicherzelle, es einleuchtenderweise mdglich ist, auch fur die 
Steuerleitungen eine konf igurierbare Vernetzung vorzusehen, um entweder an 
anderer Stelle liegende Speicherzellen anzusprechen und/oder um ggf . mehr als 

10 eine Speicherzelle ansprechen zu konnen, wenn etwa in grofiem Umfange 

Speicherbedarf fur Inf ormationen besteht, die von den Speicherzellen zu 
empfangen, abzuspeichern und/oder auszugeben ist. Aus Grunden der 
ubersichtlichkeit wird aber in Fig. 1 und 2 lediglich auf fest vorgesehene 
einzelne Steuerverbindungen Bezug genommen, was das Verstandnis der Erfindung 

15 wesentlich erleichtert. Die Steuerverbindung ist im ubrigen 

erf orderlichenf alls durch herkemmliche Leitungen, entsprechende Protokolle 
vorausgesetzt, substituierbar . 

In Fig. 2 ist die Funktionszelle 0102 als ALU und die Funktionszelle 0103 als 
20 RAM bezeichnet . Oberhalb der Reihe, in der die Zellen liegen, verlauft der 

Bus 0105a, der das bereits erwahnte Backward-Register 0103a mit den Eingangen 
0103b der Speicherzelle und 0102b der ALU verbindet. Das unterhalb der Reihe 
verlaufende Bussystem ist mit 0105b bezeichnet und es sind von dem Bussystem 
0105a, 0105b nur die relevanten Segmente gezeichnet. Es ist erkennbar, dafi 
25 das Bussystem 0105b alternativ Daten erhalt aus einem Ausgang 0102c der ALU 

0102, einem Ausgang 0103c des RAM 0103 und dafi es Daten in den Eingang 0103al 
des Backward-Registers fuhrt. 

Die ALU 0102 weist zugleich weitere Ein- und Ausgange 0102al, 0102a2 auf, die 
30 auf andere Bussegmente geschaltet sein kOnnen und uber welche die ALU Daten 
wie Operanden empfangt bzw. Ergebnisse ausgibt. 

Die Steuerverbindung 0104 befindet sich dauerhaft unter der Kontrolle der 
erweiterten Schaltkreise der ALU und stellt hier eine Verbindung dar, Uber 

35 welche eine Vielzahl von Bits ttbertragen werden kann. Die Breite der 
Steuerverbindung 0104 ist dabei so gewahlt, dafi zumindest die zuvor 
beschreibenen Steuerbef ehle an die Speicherzelle und die Forward/Backward- 
Register (FREG/BREG) ttbertragen werden kennen. Die Speicherzelle 0103 weist 
zugleich bevorzugt drei Speicherbereiche auf, namlich einen sog. Stack- 

40 Bereich, einen Heap-Bereich und einen Programm-Bereich . Jedem Bereich ist 
dabei ein eigener Zeiger zugeordnet, uber dert bestimmt ist, auf welchen 
Bereich des Stacks, des Heaps und des Programmbereiches jeweils lesend oder 
schreibend zugegriffen wird. 

45 Der Bus 0105a wird im Zeitmultiplex gemeinsam von den Einheiten 0102 und 0103 
verwendet. Dies ist in den Fig. 2b, 2c angedeutet. So ist in Fig. 2b eine 
Situation gezeigt, in welcher aus dem Ausgang 0102a2 der ALU-PAE Daten uber 
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das Backward-Register auf den Eingang der RAM-Zelle gesandt werden k6nnen, 
wohingegen der zeitgleich bestehenden, wenngleich nicht benutzten Verbindung 
zwischen dem Ausgang 0103c des RAM zum Bus 0105b und der Verbindung zwischen 
dem Ausgang des Backward-Registers BW zum Eingang 0102b der ALU-PAE zum 

5 • Zeitpunkt von Fig. 2b keine Bedeutung zukommt, weshalb diese gestrichelt 
angedeutet sind. In Fig. 2c ist hingegen ein Zeitpunkt gezeigt, zu welchem 
die Speicherzelle 0103 ttber ihren Ausgang 0103c aus dem tiber Steuerleitung 
0104 bestimmten Speicherbereich Stack (0203), Heap (0202), Program (0201) die 
Information uber das Backward-Register an den, Eingang 2b der ALU-PAE 0102 

10 speist, wahrend der Ausgang der ALU-PAE 0102c inaktiv ist und am Eingang 
0103b der RAM-PAE kein Signal empfangen wird. Aus diesem Grund sind die 
entsprechenden Verbindungen strichpunktiert und somit als inaktiv 
dargestellt. 

15 Innerhalb der RAM-Zelle 0103 ist eine Schaltung 0103d vorgesehen, in der die 
uber die Steuerleitung 0104 bzw. das Steuerleitungsbus segment 0104 empfangene 
Information decodiert wird. 
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Die Ausfuhrungsvariante der Erfindung wird verwendet wie folgt: 



Zunachst empfangt die ALU 0102 Konf igurationsinf ormation von einer zentralen 
Ladelogik, wie im Stand der Technik bereits bekannt. Die 
Informationsubertragung kann in per se bekannter Weise unter Verwendung des 
RDY/ACK-Protokolls und dergleichen geschehen. Auf die Mdglichkeit, bei der 
25 Ladelogik einen FILMO-Speicher usw. vorzusehen, urn eine ordnungsgemaSe 
Konfiguration der Anordnung zu ermeglichen, wird hingewiesen. 

Mit den Daten far die Konfiguration der ALU 0102 wird zugleich eine Reihe von 
Daten aus der Ladelogik ilbertragen, die ein sequenzerartig abzuarbeitendes 
30 Programm darstellt. Dieses Programm kann entweder bereits das zur Berechnung 
bzw. Ausftthrung der Applikation auszufuhrende Programm sein, oder einen 
Urlader (Boot) darstellen, der erst das auszufuhrende Applikationsprogramm 
von einer externen Einheit (Speicher, Peripherie) ladt. Das Laden des 
Programmes kann entf alien, wenn ein Teil des der ALU z ugeordne ten Speicher s 
35 nichtflUchtig (z. B. ROM, EPROM, EEPROM, Flash-ROM) ausgestaltet ist und eiri 
Urlader oder das Applikationsprogramm dort fest gespeichert ist. Dies kann 
insbesondere dann von Vorteil sein, wenn die Applikation vorab bekannt ist 
und unabanderlich gestaltet werden kann, da eine feste Implement! erung dann 
zu einer erheblichen Kostenreduktion ftihren kann. Die ALU gibt deshalb 
40 wahrend ihrer Konfiguration auf der Leitung 0104 einen entsprechenden Befehl 
aus, der den Programmzeiger zum Schreiben auf einen vorgegebenen Wert 
innerhalb des RAM setzt. Danach werden von der Ladelogik bei der ALU 
empfangene Daten uber den Ausgang 0102c ttber den Bus 0105bl und das Backward- 
Register 0103a gespeist und gelangen von dort in den Eingang 0103b der RAM- 
45 PAE 0103. Von der Einheit 0103d werden entspre'chend des Steuerbef ehls auf 
Steuerleitung 0104 dann Daten auf den angewiesenen Programmspeicherplatz 
geschrieben. Dies wiederholt sich, bis samtliche, von der Ladelogik bei der 
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Konfiguration empfangenen Programmteile in der Speicherzelle 0103 abgelegt 
sind. Wenn dann die Konf iguration der ALU beendet ist, wird diese durch 
Ausgabe der entsprechenden Befehle auf der Steuerleitung 0104 die nachsten, 
von ihr seguenzerartig abzuarbeitenden Programmschritte anfordern und ttber 
5 den Ausgang 0103c, den Bus 0105b, das Backward-Register der RAM-PAE 0103 und 
den Bus 0105a an ihrem Eingang empfangen. Wahrend der Prograramabarbeitung 
kannen dabei Situationen auftreten, bei denen Sprtinge innerhalb des 
Programmspeicherbereiches erf order lich sind, Da ten in die ALU-PAE aus der 
RAM-PAE geladen werden, Daten im Stack abgelegt werden mtlssen usw. Die 

10 diesbezttgliche Kommunikation zwischen ALU-PAE und RAM-PAE erfolgt tiber die 
Steuerleitung 0104, so daS die ALU-PAE zu jedem Zeitpunkt die Dekodierung 
durchftihren kann. ttberdies kannen auch, wie bei einem herkammlichen 
Mikroprozessor, Daten aus einem Stack oder einem anderen RAM-Speicherbereich 
empfangen werden und es kannen liberdies Daten von aufierhalb als Operanden in 

15 der ALU-PAE empfangen werden. 

Es findet dabei die Abarbeitung der Programmsequenz statt, die in den RAM-PAE 
durch die Ladelogik vorkonf iguriert wurde. In der ALU-PAE wird dabei 
zugleich, wie per se erf order lich, eine Bef ehlsdekodierung vorgenommen. Dies 
20 geschieht mit den per se gleichen Schaltkreisen, die schon fur die 

Dekodierung der von der Ladelogik erhaltenen Befehle verwendet werden. 

Es wird tJber die ALU zu jedem Zeitpunkt die Steuerleitung 0104 kontrolliert, 
so daS die RAM-Zelle stets genau die Art des Speicherzugrif f es befolgt, die 
25 von der ALU vorgegeben ist. Auf diese Weise ist sichergestellt, daS 

ungeachtet der Zeitmultiplex-Benutzung der Buselemente 0105a, b jederzeit den 
in der Seguenzerstruktur vorhandenen Elementen vorgegeben ist, ob auf den 
Bussen Adressen fur zu holende und/oder zu schreibende Daten oder Codes 
liegen oder ob und gegebenenf alls wohin Daten zu schreiben sind etc. 

30 

Die in Bezug auf Fig. 2 gezeigte Anordnung kann auf unterschiedliche Arten 
erweitert oder -verandert werden. Besonders relevant sind die in Fig. 3a und 
3b dargestellten Varianten. 

35 Nach Fig. 3a ist zur Verbindung von oberen und unteren Bussen nicht nur ein 
Backward-Register an der RAM-PAE vorgesehen, sondern es sind auch ein 
Vorwarts -Register an der RAM-PAE und Vorwarts- und RUckwarts -Register an der 
ALU-PAE vorhanden. Diese kannen, wie durch die Mehrf ach-Pf eile angedeutet, 
dazu dienen, von anderen Einheiten, wie extemen Hosts, externen Peripherie- 

40 Geraten wie Festplatten, Hauptspeicher und dergleichen und/oder von anderen 
Sequenzerstrukturen, PAEs, RAM-PAEs etc. Daten zu empfangen und an diese zu 
senden. Wenn ein entsprechender Anforderungsbef ehl fur neue Programmteile aus 
der Sequenzerstruktur, die durch die ALU-PAE und die RAM-PAE gebildet ist, 
abgesandt wird, ist es maglich, Programmbiacke in der Seguenzerstruktur 

45 abzuarbeiten, die weit graSer sind als jene, die in der RAM-PAE speicherbar 
sind. Dies ist insbesondere bei komplexen Datenverarbeitungsauf gaben, 
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Sprtingen tlber weite Bereiche, insbesondere in Unterprogramme usw. von 
massivem Vorteil . 

Eine noch weiter bevorzugte Variant e ist in Fig. 3b gezeigt. Hier 
5 kommuniziert die ALU-PAE nicht nur mit einer RAM-PAE, sondern zugleich mit 
einer Input /Output-PAE, die dazu ausgebildet ist, eine 

Schnittstellenbeschaltung far die Kommunikation mit extemen Bauelementen 
vorzusehen, wie Festplatten, anderen XPP-VFUs, fremden Prozessoren und 
Coprozessoren usw* Wiederum ist die ALU-PAE die Einheit, die als Master ftlr 
10 die als „CMD* bezeichnete Steuerverbindung arbeitet und wiederum werden die 

Busse in Multipl ex-Wei se verwendet. Auch hier kann eine Obertragung von Daten 
von dem Bus unterhalb der Reihe in den Bus oberhalb der Reihe durch das 
Backward-Register erfolgen. 

15 Die in Fig. 3b gezeigte Anordnung erm6glicht es, externe Zugriffe auf nicht 

in der Speicherzelle RAM-PAE abspeicherbare Inf ormationen besonders leicht zu 
gestalten und ermaglicht damit eine Anpassung der Sequenzerstruktur an 
bestehende, herkemmliche CPU- Techno logi en und deren Betriebsverf ahren in noch 
starker em MaSe insoweit, als nun in der Eingabe-Ausgabezelle 

20 Adresstibersetzungsmittel, Speicherverwaltungseinheiten (MMU-Funktionen) und 
dergleichen implementiert sein kdnnen. Die RAM-PAE kann hier etwa als Cache, 
insbesondere aber als vorgeladener Cache dienen. 

Es sei darauf hingewiesen, daS mehrere Sequenzerstrukturen gleichzeitig in 
25 ein und dasselbe Feld hineinkonf iguriert werden kdnnen, daS Funktionszellen, 
Speicherzellen und ggf . Ein-Ausgabezellen wahlweise fur Sequenzerstruktur en 
und/oder eine fur die XPP-Technologie herkammliche Weise konfiguriert werden 
kennen und daS es ohne wei teres mGglich ist, da£ eine ALU an eine andere ALU 
Daten ausgibt, die diese in einer Sequenzer- Weise konf igurieren und/oder zum 
30 Teil eines Zellelmentef eldes machen, mit dem eine bestimmte Konf iguration 
abgearbeitet wird. Auf diese Weise wird dann gegebenenf alls auch die 
Ladelogik entbehrlich. 

Figur 4 zeigt nun noch einmal detailliert den Grundaufbau einer PAE. Der Kern 
35 einer PAE, typischerweise bestehend aus einer Oder mehreren ALUs und/oder 

einem Speicher und/oder FPGA-Elementen erhait Daten von dem Bussystem 0105a 
und ttbertragt die Ergebnisse der Datenverarbeitung an das Bussystem 0105b. 
Neben dem Kern sind die Forward-Register (FREG, 0402) und Backward-Register 
(BREG, 0403) angeordnet und ttbertragen Daten von 0105a nach 0105b (FREG) bzw. 
40 von 0105b nach 0105a (BREG) .BREG und FREG konnen ebenfalls eine oder mehrere 
ALUs und/oder einem Speicher und/oder FPGA-Elementen enthalten. Bevorzugt 
sind diese jedoch in ihrem Funktionsumf ang gegenuber dem Kern (0401) 
eingeschrankt . 

Die Bussysteme 0105a und 0105b sind bevorzugt jeweils in ein Bussystem zur 
45 tfbertragung von Daten (DATA) und ein Bussystem zur tJbertragung von Trigger, 
also Statussignalen (TRIGGER) unterteilt. 
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Die Konf iguration der PAE erfolgt durch eine tlbergeordnete 
Konfigurationseinheit (z. B. eine CT) , die tiber einen Konf igurationsbus 
(0404) Konfigurationsworte an die PAE tibertragt. Diese werden in 
Konf igurationsregi stern gespeichert (0405) . Optional kann ein 
Konfigurationsstack. (0406) nacb PACT17 und wie nachfolgend beschrieben 
zwischen den Konf igurationsbus (0404) und die Konf igurationsregi ster (0405) 
zwischengeschaltet sein. 

Der Konfigurationsstack kann Daten und/oder bevorzugt Trigger von den 
Bussystemen 0105 (a/b) empfangen und an diese senden. 



Die PAE kann optional einen AnschluS an ein dediziertes Bussystem (IO- 
Channel, 0407) aufweisen. Zur Steuerung des Bussystems ist dem Kern (0401) 
eine zusatzliche Bussteuereinheit (0408) zugeschaltet . ttber den IO-Channel 
kan die PAE direkt mit einem globalen, ggf . auch externen Speicher und/oder 
15 Peripherie und/oder anderen PAEs Daten tiber tragen. 

In einer bevorzugten Ausgestaltung besteht die Moglichkeit Konstanten fur die 
Datenverarbeitung tiber 0404 zu setzen. In einer weiteren Ausgestaltung kann 
eine Konfigurationseinheit (z. B. CT) Daten aus den Arbeitsregistern 
20 auslesen. 

Figur 4 kann auch eine entsprechende RAM- PAE darstellen. uber 0404 kann dann 
von einer CT die Vernetzung und Funktion des RAMs eingestellt werden. 
Die Funktion umfaSt beispielswiese folgende Funktionen oder Kombinationen 
25 daraus : 

1. Random Access 

2 . FIFO 

3 . Stack 
30 4. Cache 

5. Page Memory fur MMUs 

Desweiteren kann in einer bevorzugten Ausftihrung der Speicher mit Daten von 
der CT vorgeladen werden (z. B, Konstanten, 
35 Lookup-Tabelleri, etc.). Ebenfalls kann die CT in einer erweiterten Ausftihrung 
Daten (z. B. ziim Debuggen oder fur Taskwechsel) aus dem Speicher uber 0404 
zurUcklesen. 

in einer bevorzugten Ausftihrung kann eine RAM- PAE mehrere Anschltlsse an das 
Bussystem 0105 aufweisen (dual -port Oder multi-port) , wodurch mehrere 
40 Datentransfers gleichzeitig durchgeftlhrt werden kSnnen. 

In einer weiteren Ausftihrung kann die RAM- PAE einen dedizierten Anschlufi an 
einen externen Bus aufweisen. 

RAM- PAEs kttnnen derart zusammengeschaltet werden, dass aus mehreren (n) RAM- 
PAEs ein n-fach grOfierer Speicher entsteht. 

45 
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Figur 5 zeigt eine Ausgestaltungsvariante des Sequenzers nach Figur 3b. Die 
ALU-PAE weist einen minimal en Regis tersatz Ra, Rb, Rx auf, der in diesem 
Beispiel lediglich zur Pufferung der Operanden und Ergebnisse dient. Der 
eigentliche Registersatz liegt in der RAM-PAE (RO..Rn). Ebenfalls innerhalb 
5 der RAM-PAE liegen die Register 
Rpp: Programm Pointer 

Rap: Adress Pointer fur Datenzugrif f e (z.B. Heap) 

Rsp: Stack Pointer fur Stackzugrif f e 

Rfp: Frame Pointer zur Sicherung des Stack Pointers 

10 bei Unterprogrammaufruf en 

Der CMD-Bus wird von der ALU-PAE gesteuert und tiber tragt die 
Ablauf information des Sequenzers an samtliche beteiligten PAEs, sowie FREG 
und BREG zur Steuerung der DatenObertragung auf den Bussystemen (0105a, 
15 0105b) . 

Die RAM-PAE weist in diesem Ausgestaltungsbei spiel einen dedizierten IO- 
Cannel (0501) auf, tiber welchen sie ggf. auch selbststandig <z. B. tiber DMA- 
Kontroller) Daten von oder zu peripheren Einheiten (z.B. 10, Speicher) 
tibertragen kann. Es soli nochmals darauf hingewiesen werden, dass. aucb die 
20 ALU-PAEs einen solchen dedizierten Anschlufi aufweisen k6nnen oder in einer 
weiteren Ausgestaltungsvariante die ALU-PAE anstatt der RAM-PAE einen 
derartigen Anschlufc besitzen kannte. 

Optional sind eine oder mehrere Datenaustauschvorrichtungen mit den 
restlichen Zellen des PAs (z. B. Funktions- und/oder Speicherzellen) 

25 implementiert. uber Eingabe-Ports (0502) konnen Daten von dem PA gelesen 
werden und Uber Ausgabe-Ports (0503) kSnnen die Daten ausgetauscht werden. 
Die Port werden beispielsweise tiber die CMD-Steuerkommandos read__port und 
write_port angesteuert und schalten die Bussysteme entsprechend . Mit den 
Steuerkommandos wird ein Selektor tibertragen, der anzeigt welcher Port durch 

30 das Steuerkommando angesprochen ist. 

Die vorliegend of fenbarte Lage der Register innerbalb der RAM-PAE ist 
ungewShnlich, bietet aber zwei erhebliche Vorteile: 

a) Speicherzellen kannen fur die Register verwendet werden. 

b) Die Pointer liegen direkt in der RAM-PAE, wodurch Datenzugrif fe auf den 
35 Speicher besonders schnell werden. Desweiteren ist fttr samtliche Speicher- 

Zugriffe nur ein Bus auf dem Bussystem 0105 notwendig, wobei der 
normalerweise zusatzlich erf orderliche Adressbus entfallt, da die Adressen 
lokal in der RAM-PAE durch die Pointer gegeben sind. 

Diese Anordnung wird daher als vom Anmelder bevorzugt typisch implementiert. 

40 

Ftir samtliche Datentransf ers ist die Lage der Register zu beachten. Urn 
lediglich maglichst einfache Befehle im Sequenzer zu implementieren, sind 
daher besondere Befehle zur Regis termanipulation vorgesehen: 
moveta Rrr: Ladt das Register Rrr (rr € {l..n, sp, pp, 
45 fp, ap}) nach Ra 

movetb Rrr: Ladt das Register Rrr nach Rb 
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movefx Rrr: Schreibt das Register Rx nach Rrr 

Urn den Datenf luficharacter der ALU zu wahren, ist bevorzugt ein weiterer 
besonderer OpCode implementiert : 
5 feed: Ubertragt Da ten von Ra/Rb nach Rx, ohne diese 

zu manipulieren. 

Nachfolgende Beispiele verdeutlichen die Arbeitsweise des Sequenzers: 
Addiere Register Rl zu Register R2 und schreibe Ergebnis nach Register R2 : 
10 move t a Rl; movetb R2; add; movefx R2; 

Schiebe Register R4 nach Register R7: 
move t a R4; feed; movefx R7; 

15 ubertrage R5 auf Stack: 

moveta R5; feed; push; 
Anmerkung: push ubertragt Daten des Registers Rx an die Speichers telle auf 
die Rsp zeigt und dekrementiert (bzw. inkermentiert) Rsp. 

20 Setze Adresspointer Rap mit der indirekten Adresse R4 addiert zu R7 : 
moveta R4; movetb R7; add; movefx Ra; 

Lade Daten aus Speichers telle Rap nach Rl : 
load; feed; movefx Rl; 
25 Anmerkung: load ubertragt Daten von der Speichers telle auf die Rap zeigt nach 
Ra. 

Die Datenregister werden bevorzugt innerhalb des Speichers der RAM-PAE 
angeordnet, z. B. von Adresse 0x0 bis 0x7 (fur n = 7) . Register werden 
30 beispielsweise angesprochen , indem beim Auftreten des entsprechenden CMD 

Steuerkommandos (z. B. read_reg, write_reg) die Regis ternummer mi tuber tragen 
wird, diese als Adresse an den Speicher ubertragen wird und die hSherwertigen 
Adressbits mit 0 gefullt werden. 

Die Startadresse fur den Code ware dann beispielsweise 0x8 (also 0x(n+D), 
35 worauf dann der Programmpo inter Rpp nach einem Reset zeigen wttrde. 

Die Adresszeiger werden bevorzugt nicht im Speicher abgelegt, sondern in 
gesondert implementierten Regis tern untergebracht, urn eine schnelle und 
einfache Aufschaltung auf die Adressleitungen des Speichers zu ermOglichen. 

40 In Figur 5b ist eine Architekturvariante mit Registersatz innerhalb der ALU- 
PAE dargestellt. Die umstandlichen Register trans f er opera tionen entf alien 
damit, wodurch diese Variante auch erheblich schneller in der 
Datenverarbeitung ist. Allerdings ist sind die Hardwarekosten hiiher, da der 
Registersatz zusatzlich implementiert werden muss und fur samtliche 

45 speicherzugrif fe die Adressen von der ALU-PAE an die RAM-PAE ubertragen 
werden mils sen. 
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RAMoverPAE 

Die nachfolgend beschriebene besondere Ausgestaltung einer ALU-PAE (im 
Folgenden mit ROP-PAE bezeichnet) eignet sich besonders fur VPUs, deren 
Applikation irregulare sequentielle Codes aufweisen, die auf kleine 
5 Datenmengen in einer weitgehend ungeordneten Reihenfolge zugreifen. 

Zur Realisierung dieser Aufgabe wird in eine ALU-PAE Speicher integriert 
(Integrated RAM = IRAM) , auf den die ALU direkten Schfeib/Lese-Zugrif f 
besitzt. Die ALU ist entsprechend urn eine Adressverwaltungsschaltung 
10 erweitert. Insbesondere kdnnen daher PAEs nach dem vorstehend beschriebenen 
Aufbau (IPAEs) verwendet werden, wobei der separate RRAM ggf. entfallt und 
durch den integrierten I RAM ersetzt ist oder der RRAM zusatzlich zum internen 
I RAM quasi als Speichererweiterung vorgesehen ist. 

15 In einer besonders bevorzugten AusfOhrung ist ein Sequenzer bzw. 

Microcontroller mit einem bevorzugt limitierten aber bevorzugt vollstandigen 
Befehlssatz (vgl . ARC Microprocessor) in der ROP-PAE integriert, der die 
Verarbeitung sequentieller Codes ermdglicht. In einer weiteren 
Ausftthrungsvariante kann der Sequenzer in seiner Funktion und seinem 

20 Ablaufverhalten auch konf igurierbar ausgestaltet sein (wie beispielsweise 

nach dem Stand der Technik bekannt, z.B. durch EPS448 von Altera [ALTERA Data 
Book 1993]). Der Sequenzer /Microcontroller kann auf Zustande (z.B. 
Statussignale, Ereignisse) in der ROP-PAE und/oder auf Zustande (z. B. auch 
Trigger) anderer PAEs die mit der ROP-PAE verbunden sind (z.B. tiber ein 

25 Bussystem) reagieren. 

Der Sequenzer /Microcontroller liest seine Programmbef ehle aus dem I RAM. 
Die Zugriffe auf das Bussystem des Arrays (PA) entsprechen den tlblichen PAEs , 
ebenso- die Generierung, der Empfang und die Weiterleitung von Statussignalen 
(Trigger nach PACT 08 ) . Mehrere Busanbindungen fur Daten- und Triggereingange 

30 und fUr Da ten- und Triggerausgange kdnnen vorgesehen sein. 

• Die ROP-PAE kann Operanden vom Bus lesen ggf. mehrzyklisch Verarbeiten und 
das Ergebnis wieder auf den Bus schreiben. 

In die ROP-PAE ist in einer bevorzugten Ausgestaltung ein Registersatz 
integriert. Der Registersatz kann in einer besonderen Ausgestaltung ahnlich 

35 des Registersatzes von Transputern als Stack organisiert. Dadurch kann der 
Registersatz besonders klein und hardware technisch effizient realisiert 
werden ( typischerweise reichen 3 Register A, B und C aus). Weiterhin ist aus 
der Transputertechnologie bekannt, dass Compiler effizient mit einem 
derartigen hardwaretechnisch kostengtinstigen Registersatz arbeiten kdnnen. 

40 Ebenfalls kann der Registersatz optional im RRAM liegen. 

In einer bevorzugten AusfOhrung besitzt die ROP-PAE direkten AnschluS 
(EXTBUS) an ein externes RAM und/oder externe 10. Es kdnnen 

applikationsabhangig mehrere EXTBUS vorgesehen sein. In einer dabei besonders 
45 bevorzugten Ausgestaltung kann der EXTBUS tiber eine, ggf- dedizierte, 
Verbindung des PAE-Bus systems an eine Interf ace-Baugruppe (IOAG) wie 
beispielsweise aus DE 196 54 595.1-53 oder DE 102 06 653.1 bekannt 
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realisiert sein. Die Ansteuerung von Speicher (RAM) und/oder Peripherie (IO) 
erfolgt dabei durch die Interf ace-Baugruppe . 

In einer bevorzugten Ausftthrung kann die* ROP-PAE und dabei bevorzugt das I RAM 
5 direkt selbstandig Adressen ftir das externe RAM und/oder die externe IO 
und/oder andere interne Speicher (RRAM/IRAM) generieren und externe Oder 
interne Datentransf ers selbstandig steuern. Diese Funktion kann durch 
eigenstandige im RRAM implementierte Adressgeneratoren realisiert werden. 
Beispielsweise eignen sich DMA-Kontroller besonders fur diese Aufgabe, indem 

10 sie blockweise Daten zwischen den Speichern kopieren. Der Adressraum der zu 
lesenden Daten und der Zi el adressraum wird entsprechend gesetzt und der 
Kopiervorgang wird gestartet. Das Setzen kann durch die IPAE erfolgen. 
In einer hardwaremafiig aufwendigeren Lasung kann die Funktion durch eine 
implementierte MemoryManagementUnit (MMU) realisiert sein. Die Funktionsweise 

15 ist durch den Stand der Technik definiert und bekannt. ZusammengefaSt 
arbeitet eine MMU wie folgt: 

Der von der MMU verwaltete RRAM Speicher ist in mehrere Seiten (Pages) * 
aufgeteilt. Jede Page enthalt Daten eines virtuellen Speicherraumes innerhalb 
eines externen Speichers. Beispielsweise konnen die hexadezimalen RRAM- 

20 Adressen OxOaOO. . OxOaf f Daten des externen Speichers an den Adressen 

0xbdl3200. .0xbdl32ff enthalten. Zur Verwaltung der Adressumsetzung wird eine 
Adresstibersetzungseinheit verwendet, die gewQhnlicherweise durch Lookup- 
Tabellen realisiert ist. Aufgabe einer MMU ist es insbesondere einen grofien 
Speicherraum auf einen sehr viel Kleineren (in diesem Fall der RRAM) zu 

25 ttbersetzen. Dies geschieht derart, dass Seiten je nach Bedarf von dem grofien 
Speicherraum in den Kleinen kopiert werden. Sobald eine Seite nicht mehr 
benotigt wird kann diese gelOscht und/oder uberschrieben werden. Wenn die 
. Daten auf der Seite verandert wurden, wird die Seite bevorzugt vor dem 
LOschen/Oberschreiben in den groSen Speicherraum zuruckgeschrieben. 

30 Die Adressumsetzungseinheit arbeitet derart, dass ein haherwertiger Teil der 
physikalischen Adresse (also die Adresse der Seite) in dem Lookup -Speicher 
abgelegt wird und auf die entsprechenden Daten der Seite im RRAM zeigt, 
sobald die Seite innerhalb des kleinen Speichers (RRAM) verftigbar ist. 
Dadurch kann ein Zugriff auf die Seite erfolgen. Fehlt die Seite im RRAM ist 

35 auch keine Referenz eingetragen. In diesem Fall muss die Seite erst von dem 
grofcen (externen) Speicherraum in den RRAM kopiert werden. Hierzu kann eine 
andere bevorzugt aktuell nicht verwendete Seite gemafi dem vorstehenden Ablauf 
Uberschrieben werden. 

Das Kopieren- kann dabei automatisiert, also ohne wesentliche Beteiligung 
40 durch den Sequenzer erfolgen, indem von der MMU ein DMA-Kontroller 

angesteuert wird. Diesem werden die entsprechenden Seitenadressen im RRAM und 
externen RAM, sowie die SeitengraSe durch die MMU zur Verfiigung gestellt (z. 
B. in Register eingetragen) . 



45 Die ROP-PAE besitzt einen Anschlufi an eine Konf igurationseinheit die die ROP- 
PAE entsprechend des ttblichen Verfahrens konfiguriert und rekonf iguriert. In 
einer bevorzugten Ausftihrung kann die CT auf den I RAM lesend und/oder 
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schreibend zugreifen, um Daten und/oder Code fUr den Sequenzer im IRAM zu 
verwalten. 

In einer besonders bevorzugten Ausgestaltung kann die ROP-PAE selbstandig 
5 Code fur den Sequenzer tiber das PA Bussystem und/oder den EXTBUS aus dem 
externen RAM laden. 

In einer bevorzugten AusfUhrung ist der IRAM in mehrere Segmente unterteilt, 
die in unterschiedlichen Adressbereichen liegen. Die Segmente kannen 
10 beispielsweise fur einige der folgenden Funktionen aufgeteilt sein: 

Sequenzerspeicher, Stack (z.B. fur Regis tersatz) , Datenspeicher, Heap, IO- 
Puffer, Puffer zu externem RAM bzw. Cache, Lookuptabellen, Konf igurationen 
fttr PAEs und/oder Busse, der Regis tersatz der ROP-PAE. 

Je nach Funktion kOnnen dazu folgende Ansteuermechanismen vorgesehen sein: 
15 Sequenzer-/Code-Speicher: Programmzeiger auf die entsprechenden 
Speicherstellen (Rpp) . 

Stack: Stackzeiger auf die oberste Speichers telle des Stack (Rsp) , 
gegebenenfalls auch ein FramePo inter (Rfp) , wie er nach dem Stand der Technik 
(z.B. Intel Pentium) bekannt ist. 
20 Konf igurationen ftir PAEs und/oder Busse: Hierrauf kann ein Zeiger innerhalb 
der CT und/oder - implement ierungsabhangig ein Zeiger innerhalb * der 
Konfigurationssteuerung der PAE zeigen. 

Registersatz der IPAE: Sollte der Registersatz der PAE im Speicher 
untergebracht sein, wir dieser direkt durch die PAE mit bevorzugt 

25 hardwaretechnisch fest vorgegebenen adressiert. 

Die restlichen Speicherbereiche, wie Datenspeicher, Puffer, Tabellen werden 
typischerweise durch den Compiler oder Programmierer aufgebaut. Die 
Adressierung dieser Bereich erf olgt durch das auszuftthrende Programm und/oder 
Betriebssys terns und wird innerhalb der Programmes und/oder Be triebs systems, 

30 ggf . unter Zuhilfenahme der Registersatzes und der AliU des Sequenzers, 
berechnet . 

In -einer mSglichen Variante ist der IRAM komplett oder teilweise, wie bei den 
IPAEs beschrieben, durch RAM-PAEs aufierhalb der ROP-PAE realisiert. Ftir ggf. 
unterschiedliche Segmente k6nnen unterschiedliche RAM-PAEs verwendet werden. 

35 

In einer bevorzugten Ausgestaltung kdnnen einige oder alle Segmente als 
aktive Speicher ausgestaltet sein, also eine DMA und/oder MMU besitzen und 
somit selbstandig Daten in oder aus den ihrem Speicher von oder nach anderen 
Speichem oder Peripheriegeraten kopieren. Insbesondere k6nnen sie die 
40 Funktionen der Speicher aus der DE 199 26 538.0 aufweisen, z. B. FIFO, 
Stack, Random Access, Cache, etc., wobei ftir jedes Segment einzeln die 
Funktion konf igurierbar und/oder durch den Sequenzer programmierbar ist. 

In einer AusfUhrung kann der IRAM als Multi-Port Speicher ausgeftihrt sein. 
45 Dieser kann den ggf. auch gleichzeitigen Schreib- und/oder Lese-Zugrif f durch 
mehrere Speicherzugrif f seinheiten auf den Speicherinhalt ermdglichen. 
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Speicherzugrif fseinheiten konnen beispielsweise externe und/oder interne 
Peripherie, Prozessoren, andere PAEs sein. 

In einer besonderen AusfUhrung kann die ROP-PAE als lokale und ggf . auch 

5 globale Konf igurationseinheit ahnlich einer CT fur ROP-PAEs in der Umgebung 
arbeiten oder unter anderem diese Funktion mit erf alien. Bevorzugt arbeitet 
die ROP-PAE nach dem aus der DE 196 54 846.2-53 bekannten Verfahren bei der 
Verwendung als lokal Konf igurationseinheit . Wird die ROP-PAE als globale 
Konf igurationseinheit verwendet, oder hat sie sehr viele lokale PAEs zu 

10 konfigurieren, wird bevorzugt das Verfahren nach der DE 196 54 593.5-53 

verwendet, das eine FILMO-Funktionalitat aufweist und daher sehr viele auch 
unabhangige Konf igurationen verwalten kann. Die ROP-PAE adressiert gesteuert 
durch den Sequenzer /Microcontroller Konf igurationen im I RAM und konf iguriert 
ai ese a n PAEs und/oder sich selbst und/oder bestimmt den Ablauf des 

15 Sequenzers/Microcontrollers. Bevorzugt findet hierbei eine Synchronisation 
mit einer Obergeordneten Konf igurationseinheit (z. B. CT oder andere PAEs) 
ahnlich der bekannten Inter -CT-Protokolle (DE 198 07 872.2, DE 100 28 397.7 , 
DE 199 26 538.0 ) statt. Die ROP-PAE kann Konf igurationen tiber eines der 
EXTRAM- Interfaces selbst laden und/oder Konf igurationen von einer 

20 tibergeordneten Konf igurationseinheit tiber das. CT Interface anfordern. Die 
Funktionsweise kann ahnlich der Rekonf igurationseinheit in der DE 196 5.4 
846.2-53 sein. 

ZusammengefaSt ist der prinzipielle Arbeitsweise einer ROP-PAE ahnlich eines 
25 Microcontrollersystemes, dessen Busanbindung und/oder dessen Datentransf ers 
und/oder dessen Prograromablauf einem VPU- System entspricht. Mit anderen 
Worten handelt es sich urn eine Multiprozessoranordnung, deren Bussystem auf 
dem Prinzip der VPU-Architektur beruht. Die einzelnen Prozessoren werden von 
bevorzugt von einer ttbergeordneten Steuereinheit (CT) verwaltet. Die 
30 Datentibertragung ist selbstsynchronisierend Ober die RDY/ACK Protokolle der 
Bussysteme. Als ein besonders wesentlicher Aspekt wird der gemeinsame 
Prozessorstatus angesehen, der tiber das Triggerbus system reprasentiert wird 
und den Status einer Menge von Prozessoren- reprasentiert, der unter den 
Prozessoren zur Ablauf steuerung ausgetauscht werden muS. Hierzu wird 
35 verwiesen auf DE 197 04 728.9, DE 101 39 170.6 und DE 101 29 237.6-53. 

Ebenfalls wird Schutz beansprucht fur ROP-PAEs, die zusatzlich zu ihrem 
Anschluss an die internen Bussysteme des Arrays aus PAEs einen dedizierten 
Anschluss (IO-Channel) an ein ttberregionales Bussystem aufweisen, das 

40 insbesondere Da ten Uber lange Strecken innerhalb des Arrays tiber tragt 

und/oder insbesondere einen direkten Anschlufc an die Peripherie aufweist. Der 
AnschluS an die Peripherie kann dabei direkt erfolgen, indem z. B. das 
Bussystem bereits dem peripheren Protokoll entspricht oder tiber entsprechende 
Protokollwandler zur Umsetzung des Protokolls erfolgen. Das dedizierte 

45 Bussystem kann dabei bereits einem Industries tandard entsprechen, z. B. PCI, 
RapidIO, Firewire, USB, Ethernet, RAMBUS, DDR-RAM, etc. urn somit einen 
einfachen und ' unauf wendigen Anschluss der peripheren Gerate zu ermoglichen. 
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Gegebenenfalls konnen auch in zwischengeschalteten IOAGs (vgl. DE 196 54 
595.1-53 ) Protokollkonvertierungen derart durchgeftihrt werden, dass ein 
internes vereinfachtes und ggf . proprietares Busprotokoll auf ein Oder 
mehrere komplexere exteme Standardprotokolle tibersetzt werden. 
5 Es soil besonders darauf hingewiesen werden, dass unter Peripherie auch 

Speicher verstanden werden, wie bei den bereits aufgezahlten Busprotokoll en 
verdeutlicht wird. 

Ebenfalls ist erf indungsgemaB besonders relevant, dass PAEs auch mehrere 
Anschlusse an dedizierte Bussysteme aufweisen konnen. 
10 Desweiteren sind anwendungsabhangig auch Architekturen sinnvoll, bei denen 

nur eine Teilmenge der PAEs Anschlusse an ein dediziertes Bussystem aufweist, 
Oder unter schiedliche PAEs mit einer unterschiedlichen Anzahl von Anschlussen 
an ggf. auch unter schiedliche dedizierte Bussysteme aufweisen. 

15 Die beschriebene Struktur kann durch erweiterte und verbesserte 

Halbleiterherstellungsverfahren und -strukturen besonders leistungsf ahig 
implementiert werden, indem der Speicher auf dem physikalischen Chip raumlich 
tiber oder unter den logischen Funktionen (ALU, Steuerung, Busse, etc.) der 
PAE angeordnet wird. HierfUr wird Schutz beansprucht. 

20 Dazu wird Uber der nach dem Stand der Technik bekannten ersten 
Halbleiter struktur (z. B. Silizium) und der damit aufgebauten 
Trans is tors truktur en eine Oder mehrere weitere Ebenen von 

Halbleiterstrukturen (Trans is tors trukturen) aufgebracht, die far zusatzliche 
Funktionen genutzt werden kSnnen. Beispielsweise kBnnen in einer ersten Ebene 
25 die Logik und Gatter der PAE-Funktion und in einer weiteren zusatzlichen 
Ebene die Speicher funktionen implementiert werden. 

In einer bevorzugten Bauweise werden die einzelnen Halbleiterschichten durch 
eine Isolierschicht voneinander getrennt. Die Isolierschicht kann 
Durchkontaktierungen (Vias) aufweisen, urn Signale zwischen den einzelnen 
30 Halbleiterschichten zu ubertragen. 

Die Verdrahtungs struktur kann je nach Anwendung unterschiedlich implementiert 
sein. Beispielsweise konnen direkt tiber jeder Halbleiterschicht 
Verdrahtungsebenen und/oder eine globale Verdrahtungs ebene, die alien 
Halbleiterschichten zugeordnet ist vorgesehen sein. 

35 

Um eine wirtschaf tliche Ausbeute zu erlangen, muss sichergestellt sein, dass 
die Gesamtschaltung, also alle Halbleiterstrukturebenen zusammen, eine 
hinreichend hohe Ausbeute erreichen. Desweiteren ist zu beachten, dass der 
Stromverbrauch, also die Verlustlei stung, aller Halbleiterstrukturebenen 
40 zusammen innerhalb eines akzeptablen Bereiches bleibt, der zu keiner 
tjrberhitzung und dem damit verbundenen Ausfall der Schaltung ftihrt. 
Es kann durch eine geeignete Zusammenstellung der Funktionseinheiten der 
einzelnen Halbleiter ebenen den entsprechenden Anf orderungen entsprochen 
werden . 

45 Beispielsweise ist fur die vorgeschlagene Architektur eine Ebene von 
Logikhalbleiter strukturen und eine weitere Ebene von 

Speicherhalbleiterstrukturen vorzusehen, die fur diese Anf orderungen geeignet 
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sind. Wahrend die irregularen und wenig redundanten Logikhalbleiter struktur en 
eine vergleichsweise hohe Fehlerquote mit hoher Verlust lei stung aufweisen, 
kSnnen Speicherhalbleiterstrukturen vergleichsweise redundant mit niederer 
Fehlerquote und durch geeignete Speicherverf ahren (z. B. DRAM) auch mit 
5 geringer Verlustleistung implementiert werden. Es wird explizifc darauf 

hingewiesen, dafi es mOglich ist, Felder vorzusehen, bei welchen nicht alle 
Speicherplatze und/oder alle Logikhalbleiterstrukturen voll funktional sind; 
es ist lediglich erf order lich, Mindestanf orderungen sicherzustellen und/oder 
eine ordnungsgemaSe Verwaltung. Redundanzen sind bevorzugt fur beide 
10 Strukturen separat zu betrachten. 

Die Aufbringung der mehrfach ttbereinander liegenden Halbleisterstrukturen 
kann nach unterschiedlichen Verf ahren erfolgen. Neben dem bereits 
beschriebenen Verf ahren des Aufbringens einer weiteren Halbleiterebene ttber 

15 einer Isolierschicht , was z. B. durch Aufdampfen und/oder Aufkristallisieren 
erfolgen kann, sind auch thermische oder mechanische Verbindungen moglich, 
indem z. B. die auf zubringende Siliziumstruktur aufgeiatet • oder aufgeklebt 
wird, Zum Aufiaten eigenen sich beispielsweise auch Verf ahren, die aus den 
Technologien zum Verbinden von Halbleiterchips mit Gehausen bekannt sind. 

20 Dabei handelt es sich beispielsweise urn Ref low-Dotung oder Thermokompression. 
Prinzipiell sind auch die einfache mechanische Verbindungsmethoden maglich, 
wobei sodann die Verdrahtung beispielsweise per Wirebond erfolgen kann. 
Voraussetzung hierfttr ist, dass die Siliziumstrukturen unterschiedliche 
Grofien aufweisen, sodass die Drahte von einer Siliziumstrukturoberf lache zur 

25 nachsten gedrahtet werden konnen und, dass die Anzahl der Verbindungen 

vergleichsweise gering ist, - damit diese mittels Wirebond noch realisiert 
werden konnen. 

Zur Optimierung der Ausbeute kann insbesondere das Redundanz verf ahren nach DE 

30 197 57 200.6-33 angewendet werden. Es soli erwahnt sein, dass das Verf ahren 
nach DE 197 57 200.6-33 fur alle PAEs vorgesehen werden kann, also z. B. fur 
ALU-PAEs genauso wie fur RAM- PAEs . Mit anderen Worten kannen fur samtliche 
PAEs das in DE 197 57 200.6-33 beschriebene Redundanzverf ahren angewendet 
werden. Auch die dortigen Textverf ahren sind implementierbar . 

35 Fur PAEs mit hauptsachtlich f eingranularen Strukturen, also z. B. Speicher 

(RAM- PAEs) oder FPGAs ist es von Vorteil, diese f eingranularen Strukturen mit 
einer entsprechend f eingranularen Redundanz zu versehen, d; h. nicht oder 
nicht nur die RAM-PAE oder eine eine FPGA-Struktur aufweisende PAE mit einer 
redundanten PAE zu versehen, sondern die f eingranulare Struktur selbst mit 

40 Redundanz zu versehen. Das heisst, dass beispielseise den Speicher z el len 

(bzw. FPGA-Zellen) redundante Speicherzellen (bzw. FPGA-Zellen) zugeordnet 
werden. Die Verbindungen (Leitungen, Busse, etc.) zwischen den jeweiligen 
Zellen sind dann entsprechend an die Erf ordernisse einer redundanten Struktur 
angepafit. Der Aufbau redundanter Strukturen fur f eingranulare Zellen, wie z. 

45 B. Speicher oder FPGAs ist durch den Stand der Technik bereits bekannt. Fur 
das Verstandnis von Ausgestaltungsde tails wird auf diesen verwiesen. 
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Die Verlustleistung la£t sich rxach den Verfahren von DE 196 51 075.9-53 und 
DE 101 35 210,7-53 erheblich minimieren, wodurch sehr hohe 
Integrationsdichten ermoglicht werden. 

5 Es soil darauf hingewiesen werden, dass die Anzahl der tibereinanderliegenden. 
Halbleitersturkturen keineswegs auf zwei begrenzt ist. Mit f or tschrei tender 
technischer Entwicklung und Optimiening ist eine steigende, auch sehr gro£e 
Zahl von tibereinanderliegenden Ebenen realisierbar . 

10 Die Ebenenauf teilung muS dabei, weder bei einer zweilagigen, noch bei einer 

mehrlagigen Struktur auf eine ALU- Speicher-auf teilung limitiert sein. Bereits 
bei zweilagigen Strukturen kann es sinnvoll sein den Speicher zusammen mit 
den ALUs in eine Lage zu legen und die andere Lage komplett fur die 
Bussysteme oder die Bussysteme und IO-Ansteuerungen (IOAGs) zu verwenden. Die 

15 Bussysteme kdnnen dabei tlber die einfache Verdrahtung hinaus bevorzugt auch 
die Schaltelemente (Multiplexer, Transmission-Gates, etc.) und/oder 
Verstarkerelemente (Treiber, etc.) und/oder Synchronisationselemente 
(RDY/ACK-Steuerung) , die jeweils Halbleiterstrukturen zu deren Realisierung 
benBtigen en thai ten. 

20 Desweiteren kann es sinnvoll sein, eine Ebene fur die Konf igurationsspeicher 
und/oder Konf igurat ions register und/oder CT und deren Speicher vorzusehen. 

Figur 6 zeigt eine Imp lemen tier ung einer ROP-PAE. Architektonisch wurde die 
RAM-PAE innerhalb der ALU-PAE implementiert . Der gesamte Registersatz 

25 (R0..Rn, Rpp, Rsp, Rfp, Rap) ist in der ROP-PAE. untergebracht. Zugriffe auf 
die Register durch die ALU sind schnell und mit geringem Aufwand mOglich. 
Adressen und Daten kdnnen direkt von der ALU an den Speicher Obertragen 
werden, ohne ein Bussystem auEerhalb der ROP-PAE wie z. B. 0105 zu benGtigen. 
Bevorzugt weist eine ROP-PAE einen oder mehrere dedizierte lO-Channel zur 

30 Datentlbertragung mit der Peripherie auf (beispielsweise 0601, 0602) . 

Datenverbindungen zu den rest lichen PAEs kannen wie bereits bekannt durch 
FREG und/oder BREG realisiert werden. Hier angedeutet durch den Leseport 0603 
und Schreibport 0604. 

Bevorzugt sind ROP-PAEs bereits intern als Sequenzer ausgebildet und weisen 
35 damit bereits eine interne Rtlckkopplung des ALU-Ausgangs auf die Register 
auf. Optional kann dies auch durch die Verwendung eines ROP-PAE externen 
Busses (z.B. 0105) und einer Rtlckkopplung durch ein BREG, wie bereits bekannt 
erfolgen (0605) . 

40 Figur 7 zeigt verschiedene Aufbauvarianten von Halbleiterstapeln: 

Figur 7 a zeigt einen einfachen Aufbau mitt els Wirebond Verbindungen zur 
Datentlbertragung (0701), bei welchen zwei Dice (0702, 0703), also zwei Chips, 
aufeinander montiert sind. Ein Chip besteht stark vereinfacht aus einer 
Halbleiter ebene zur Realisierung von Transistoren (z. B. Silizium, 0704), 

45 mehreren Metalllagen zur Realisierung von Verbindungsleitungen (z. B. 

Aluminium und/oder Kupfer; dargestellt sind 3 Lagen 0705a, b,c), die jeweils 
durch eine Isolierschicht untereinander und 'gegentlber 0704 elektrisch 
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getrennt sind, und eine obere, besonders widerstandsf ahigen Isolierschicht 
0706. In die Isolierschichten sind Durchgangsleitungen aus Metall zur 
elektrischen Verbindung der einzelnen Ebenen, sogenannte Vias, eingeftigt. 

5 In Figur 7b sind die beiden Dices mittels einer Art Flip-Chip-Technologie 
miteinander verbunden, wobei die ttbertragung von Signalen durch sogenannte 
Bumps nach dem Stand der Technik erfolgt. Zusatzlich zu den durch die Flip- 
Chip-Technologie gegebenen Moglichkeiten des AnschluS von Blimps (0711) auf 
der jeweils obersten Metal 11 age soil hier die besondere erf indungsgemafie 

10 Ausgestaltung gezeigt werden, die Bumps unterhalb der Halbleiterscnicht (z.B. 
Silizium) zu kontaktieren. Dazu werden elektrische Verbindungen (z.B. 
Aluminium oder Kupfer) , also Vias (0712), durch die Siliziumschicht nach 
unten geftihrt. Die Durchftihrung erfolgt bevorzugt durch Atzen von 
entsprechenden Lochern in die Halbleiterebene. Zwischen den Verbindungen und 

15 der Halbleiterscnicht wird eine Isolierung eingeftigt. 

Die Durchftihrung kann wie bei Figur 7d angedeutet entweder direkt durch die 
Halbleiterscnicht erfolgen oder es werden, wie bevorzugt, zunachst Wannen 
(0731) in die Halblei terschicht geatzt, die mit einer Isolierung gefUllt 
werden und in welche dann die Vias eingebracht werden. 

20 

Figur 7c zeigt die besonders bevorzugte Variante zur Realisierung von 
Halbleiterstapeln. Oberhalb der obersten Isolierschicht (0721) einer ersten 
Halbleiterstruktur, die in dies em Fall dtinner aus fall en kann, wird eine 
weitere Halbleiterebene (0722) aufgebracht. Dazu wird die Isolierschicht 

25 (0722) zunachst durch Atzen und/oder Schleifen m6glichst eben gemacht. Das 
Aufbringen der Halblei terschicht kann durch Auf damp fen, Aufziehen von 
Kristallen oder bevorzugt durch Auf kl eben oder klebeahnlichen Verbindungen 
aufgebracht. Wesentlich, v. a. bei der Verwendung von Verklebungen ist, dass 
durch die aufgebrachte Halbleiterstruktur und das Verbindungsmaterial (z.B. 

30 Klebematerial) durchgeatzt werden kann. Die Durchatzung ist erf orderlich, urn 
Kontakte, wie in Fig. 7b beschrieben zu den Vias in der darunterliegenden 
Isolierschicht zu fUhren. 

Die DurchfUhrung der Kontakte erfolgt gemaS Figur 7d z. B. durch das Einatzen 
.schmaler Kanale, in die ein Isoliermaterial eingebracht wird. Danach wird in 
35 einem weiteren Schritt in das Isoliermatierial ein schmaleres Via eingeftigt, 
indem z. B. zuvor in dem Isoliermaterial ein Loch entsprechenden Durchmessers 
z. B. durch Atzen erzeugt wurde. 

Das bevorzugte Verfahren sieht das Atzen gr6sserer Wannen (0731) vor, welche, 
mit Isoliermaterial gefiillt werden. In die Wannen werden dann ggf . mehrere 
40 Vias (0712) wie beschrieben eingeftigt. 

Die Figuren 7e,f,g,h zeigen verschiedene bevorzugte funktionale Aufteilungen 
solcher Halbleiterstapel . Die Halbleiterebene ist jeweils schraffiert 
dargestellt und die Isolierschicht durch dicke Umrandung. Dazwischen liegen 
45 die Metalllage. Wie in Fig. 7g,h angedeutet ist die Konstruktion nicht auf 2 
Stapel beschrankt, ebenso sind grOfiere Stapel, z.B. mit 3,4, oder mehr Ebenen 
maglich. 
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Die mehrfache beschriebene Auftrennung zwischen Speicher und ALUs ist in Fig. 
7e dargestellt. 

Fig. 7f zeigt die Trennung der Bussysteme mit den notwendigen Schalteinheiten 
5 und der IO-Struktur von den ALUs und Speichern, die sich in diesem Beispiel 
in derselben Ebene befinden. 

In Fig. 7g liegen auf der untersten Ebene die ALUs. Auf oberster Ebene liegen 
die Speicher und ggf . die Treiber der 10. Somit sind die Strukturen mit hoher 
Verlustleistung an den auSeren Randern der Stapel untergebracht . Besonders 
10 hierftir wird Schutz beansprucht, da dadurch eine besonders optimale 

Warmeabfuhr mSglich ist. Die Bussysteme und deren Schalteinheiten sind in der 
mittleren Ebene untergebracht. 

In dem Beispiel Fig. 7h sind in den mittleren Ebenen verlustleistungsarme 
Busse und Speicher untergebracht. ALUs und die besonders energieauf wendigen 
15 IO sind zur optimalen Warmeabfuhr in den Randern untergebracht. 

IOx-PAEs 

Aus DE 199 26 538.0 sind Speicher (IORAM-PAEs) mit einem dedizierten 
Anschluss an externe Einheiten wie z.B. Peripherie und/oder Speicher bekannt. 
20 Weiterhin sind aus DE 196 54 595.1-53 und DE 102 06 653.1 dedizierte 
Einheiten (z. B. Interf ace-Baugruppen (IBG) ) zum Anschluss von externen 
Einheiten wie z. B. Peripherie und/oder Speicher bekannt. 

Beide Verfahren weisen das Problem auf, dass ein zusatzlicher Auf wand zur 
Datenkommunikation zwischen PAEs, insbesondere da tenverarbei tender und/oder 
25 datenberechnender PAEs und externen Einheiten betrieben werden muss, indem 
die Daten explizit zwischen den PAEs und den IBGs und/oder IORAM-PAEs 
tlbertragen werden mtissen. 

Es wird nunmehr erf indungsgemafi vorgeschlagen und wie bereits vorstehend 

30 mehrfach erwahnt fur beliebige PAEs , insbesondere jedoch fur 

da tenverarbei tende und/oder datenberechnende PAEs (z. B. ALU- PAEs nach DE 196 
51 075.9-53 , IPAEs, ROP-PAEs) und datenspeichernde PAEs (RAM- PAEs nach DE 
100 50 442.6 ) einen oder mehrere dedizierten Anschltlsse (IO-Channel) an 
externe Einheiten wie z. B. Peripherie und/oder Speicher vorzusehen. Dadurch 

35 ist eine direkte Kommunikationsmdglichkeit der PAEs, die nachfolgend IOx-PAEs 
genannt werden, und externen Einheiten gegeben. Der Vorteil dieser 
Architektur liegt darin, dass die Verbindung des Arrays aus PAEs (PA) mit der 
Peripherie (extemem Speicher und/oder 10 -Einheiten) erheblich effizienter 
aufgebaut werden kann. Die bestehenden konf igurierbaren Bussysteme der PAEs ' 

40 untereinander (BUS) mtissen nicht mit den IO-Datentransf ers belastet werden. 
Desweiteren kann bei einer entsprechenden Ausgestaltung des IO-Channel die 
Adressierung der Daten fur oder einzelne PAEs sehr viel einfacher 
durchgefuhrt werden, als dies mittels des BUS mdglich ware. 
Dies kann bevorzugt dadurch realisiert sein, dass jede an einen IO-Channel 

45 angeschlossene Einheit eine eigene eindeutige Adresse besitzt. Mittels dieser 
Adresse kann jede Einheit explizit und einfach angesprochen werden, indem die 
Adresse ttber den IO-Channel tlbertragen wird und jede Einheit diese Adresse 
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mit ihrer eigenen vergleicht. Wenn die Adressen ttbereinstimmen, ist die 
Einheit adressiert und die Daten sind ftir diese Einheit bestimmt. 
Bevorzugt kann jede Einheit nicht nur die Zieladresse, also die Adresse der 
Einheit fur die die Daten bestimmt sind, sondern auch ihre eigene Adresse 
5 ubertragen, urn eine Identi fixation des Senders zu ermoglichen. 

Besonders effizient kann das Vorsehen von IO-Channels fur nur eine Teilmenge 
aller PAEs sein. Beispielsweise bietet es sich an, nur Streifen von PAEs mit 
IO-Channel-Erweiterung innerhalb einer Anordnung von PAEs (PAE -Array, PA) 
10 vorzusehen. Dadurch wird eine verbesserte Flachen- und Kostenef fizienz 
gegenuber der Implementierung der IO-Channel-Erweiterung in alle PAEs 
erreicht . 

PAEs, die besonders hone Kommunikationsanf orderungen aufweisen, konnen 
15 applikationsabhangig auch an mehrere IO-Channel angeschlossen sein. 

Die dedizieren IO-Channels konnen dabei auf unterschiedlichen Bussystemen 
aufgebaut sein, z. B. insbesondere nach DE 197 04 742.4 oder als paralleles 
Standardbussystem wie Rapid-IO, PCI, AMBA oder serielles Standardbus system 
20 wie USB, Firewire, Ethernet. 

Besonders leistungsf ahig kann die Implementierung von IO-Channels in PAEs 
dann sein, wenn diese nicht direkt an die extemen Einheiten geftthrt sind, 
sondern zunachst an eine lO-Verwaltungs einheit (IOAG) , die ahnlich dem 

25 Protokollkonverter nach DE 102 06 653.1 oder der IOAG nach DE 196 54 595.1- 
53 aufgebaut sein kann. Der Vorzug liegt darin, dass ein einf aches internes 
Busprotokoll zur Steuerung der IO-Channels verwendet werden kann. Ebenso wird 
nur eine geringe "Intelligenz" in jeder einen IO-Channel aufweisenden PAE 
bend tig t, wodurch die PAEs jeweils flachenmaSig klein und unaufwendig zu 

30 programmieren sind. 

Die eigentliche Verwaltung und Ansteuerung der externen Einheiten wird in den 
IOAGs durchgefuhrt, die durchaus grofier und aufwendiger ausgestaltet sein 
konnen . 

35 Die IOAGs kSnnen zur Erfttllung ihrer Aufgabe selbst eigene Sequenzer und/oder 
Mikrokontroller und ggf . auch eigenen Speicher aufweisen. Insbesondere kann 
die IOAG auch Speichermanagement einheiten und Adressubersetzungseinheiten 
aufweisen. Je nach Applikation konnen Interruptkontroller wie z. B. nach dem 
Stand der Technik bekannte (18259) in der IOAG implementiert sein, die 

40 Interrupts ggf. auf Triggers ignale nach DE 197 04 728.9 Obersetzen. 



SIMD PAEs 

Bei der Verwendung von rekonf igurierbaren Technologien zur Verarbeitung von 
45 Algorithmen entsteht ein wesentliches Paradoxon: (1) es sind, urn eine 

mQglichst hohe Rechenlei stung zu erhalten, komplexe ALUs erf orderlich, wobei 
der Auf wand fttr die Rekonf igurat ion minimal sein sollte; (2) es sollten die 

31 




ALUs mCglichst einfach und feingranular sein, um eine effiziente 
Datenverarbeitung auf Bitebene zu erm6glichen; (3) es sollte die 
Rekonf iguration und Datenverwaltung derart intelligent und schnell erfolgen, 
dafi sie effizient und einfach zu programmieren ist. 

5 

Bisherige Technologien verwenden entweder a) sehr kleine ALUs mit wenig 
Rekonf igurationsuntersttitzung (FPGAs) und sind auf Bitebene effizient Oder b) 
groSe ALUs (Cameleon) mit wenig Rekonf igurationsuntersttitzung, oder c) eine 
Mischung aus groSen ALUs und kleinen ALUs mit Rekonf igurationsuntersttitzung 
10 und Datenverwaltung (VPUs) . 

Da die VPU-Technologie die leistungsf ahigste Technik darstellt, soli auf ihr 
aufbauend ein optimiertes Verfahren geschaffen werden. Es soil ausdrtlcklich 
darauf hingewiesen werden, da£ dieses Verfahren ebenfalls ftir die anderen 
Architekturen eingesetzt werden kann. 

15 

Der Flachenaufwand zur effizienten Steuerung von Rekonf igurationen ist mit 
einer Menge von ca. 10,000 bis 40.000 Gattern pro PAE vergleichsweise hoch. 
Unterhalb dieser Gattermenge las sen sich in der Regel nur einfache 
Ablaufsteuerungen realsieren, die die Programmierbarkeit von VPUs erheblich 
20 einschranken und eine Verwendung als General Purpose Prozessor erschweren. 
Sofern auf eine besonders schnelle Rekonf iguration abgezielt wird, mttssen 
zusatzliche Speicher vorgesehen werden, wodurch die erf order liche Gattermenge 
nochmals erheblich ansteigt . 

25 Um ein ordentliches Verhaltnis zwischen Rekonf igur at ions auf wand und 

Rechenlei stung zu erhalten, ist somit der Einsatz von grofien ALUs ■ (viel 
Funktionalitat und/oder groSe Bitbreite) zwingend erf orderlich. Werden die 
ALUs jedoch zu gro£, sinkt die nutzbare parallele Rechenleistung pro Chip. 
Bei zu kleinen ALUs (z. B. 4-bit) ist der Aufwand zur Konf iguration 

30 aufwendiger Funktionen (z.B. 32-bit Multiplikation) zu hoch. Insbesondere der 
Verdrahtungsaufwand wachst in kommerziell nicht mehr sinnvolle Bereiche. 

SIMP Rechenwerke 

35 Um ein ideales Verhaltnis zwischen der Verarbeitung von kleinen Bitbreiten, 

Verdrahtungsaufwand und der Konf iguration aufwendiger Funktionen zu erhalten, 
wird nun der Einsatz von SIMD-Rechenwerken innerhalb von ALU-PAEs (also 
insbesondere der in dieser Erfindung offenbarten PAEs, ebenso wie in PAEs 
nach DE 196 51 075.9-53 und DE 199 26 53 8.0 ) vorgeschlagen . Dabei werden 

40 Rechenwerke der Breite m derart zerteilt, dafi n einzelne Biecke der Breite b 
= m/n entstehen. Durch Konf iguration wird je Rechenwerk vorgegeben, ob ein 
Rechenwerk unzerteilt arbeiten soli, oder ob das Rechenwerk in einen oder 
mehrere BlOcke, jeweils gleicher oder unterschiedlicher Breite zerlegt sein 
soil . Mit anderen Worten kann ein Rechenwerk auch derart zerlegt sein, dafi 

45 innerhalb eines Rechenwerkes unterschiedliche Wortbreiten zugleich 

konfiguriert sind (z.B. Breite 32-bit, zerlegt in 1x16-, 1x8- und 2x4-bit) . 
Die Daten werden derart zwischen den PAEs Ubertragen, daS die zerlegten 
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Datenworte (SIMD-WORD) zu Datenworten der Bitbreite m zusammengef a&t werden 
und als Paket tiber das Netzwerk tibertragen werden. 

Das Netzwerk tibertragt immer ein komplettes Paket, d.h. alle Datenworte 
innerhalb eines Paketes, und werden nach dem bekannte Handshake -Verfahr en 
5 tibertragen. Einzelne Datenworte innerhalb des Paketes k6nnen dabei auch 

unbenutzt sein, d.h. keine Information en thai ten. Dies kann durch zusatzliche 
Statusleitungen und/oder Handshakesignalen wie z. B. dem RDY/ACK Protokoll 
realisiert sein. 

10 

SIMP Bus svst erne 

Fur einen effizienten Einsatz der von SIMD-Rechenwerken ist eine flexible und 
ef fiziente Umsortierung der SIMD-WORD untereinander innerhalb eines Busses 
oder zwischen unterschiedlichen Bus sen erf orderlich. 

15 Die Busschalter nach Figur llkonnen derart modifiziert werden, dafi eine 
flexible Vemetzung der einzelnen SIMD-WORD mOglich ist. Dazu werden die 
Busse tiber beispielsweise Multiplexer, Busschalter, Transmissiongates, Pass- 
Trans is tor en (nachfolgend unter dem Begriff Multiplexer zusammengef afit) 
entsprechend den Rechenwerken teilbar ausgelegt, derart da£ durch 

20 Konf iguration die Teilung bestimmt werden kann. Mit anderen Worten wird 

beispielsweise nicht ein Multiplexer der Breite m pro Bus verwendet, sondem 
n einzelne Multiplexer der Breite b = m/n. Es ist nunmehr moglich, die 
Datenbusse ftir b bit Breite zu konf igurieren. Durch die Matrixstruktur der 
Busse (Figur 11) ist die Umsortierung der Daten ebenfalls moglich, wie in 

25 Figur 12a dargestellt. 

Die Handshakes der Busse werden logisch derart verkntipft, daS ein gemeinsamer 
Handshake ftir den neu geordneten Bus aus den Handshakes der ursprtinglichen 
Busse generiert wird. Beispielsweise kann ein RDY ftir einen neu sortierten 

30 Bus aus einer logischen UND-Verkntipfung aller RDYs der Daten ftir diesen Bus 
liefemden Busse generiert werden. Ebenso kann beispielsweise das ACK eines 

■ Daten liefernden Busses aus einer UND-Verkntipfung der ACKs aller Busse 

generiert werden, die die Daten weiterverarbeiten. Prinzipiell sind bei der 
Implementierung geeignete Verkntipfungen dergestalt zu w&hlen, dass diese den. 

35 jeweils verwendeten Busprotokollen entsprechen. 

In einer ersten Aus ftihrungs variant e finden die Verkntipfungen der Handshakes 
innerhalb eines jeden Busknotens statt. Dadurch wird es moglich, einem 
Bus system der Breite m, bestehend aus n Teilbussen der Breite b, bevorzugt 
40 nur ein Hand- shake- Pro toko 11 zuzuordnen. 

In einer we iter en besonders bevorzugt en Ausgestaltung werden samtliche 
Bussysteme in der Breite b ausgestaltet, die die kleinste realisierbare Ein- 
/Ausgabe Datenbreite b eines SIMD-Word entspricht. Entsprechend der Breite 
45 der PAE Datenpfade (m) besteht nunmehr ein Ein-/Ausgangsbus aus m/b = n 
Teilbussen der Breite b. Beispielsweise besitzt eine PAE mit 3 32bit 
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Eingangsbussen und 2 32 bit Ausgangsbusse bei einer kleinsten SIMD-Wortbreite 
von 8 tatsachlich 3x4 8bit Eingangsbusse und 2x4 8bit Ausgangsbusse. 
Jeder der Teilbusse weist bevorzugt samtliche verwendeten Handshake- und 
Steuersignale auf, beispielsweise RDY/ACK und der Reconf ig-Trigger nach DE • 

5 197 04 72 8.9 und ein globales Reset Signal, etc. 

Der Ausgang einer PAE versendet bevorzugt dieselben Steuersignalen fur 
samtliche n Teil-Busse. Eingehende Quittierungssignale aller Teilbusse werden 
bevorzugt miteinander logisch verkntipft, z. B. durch eine UND-Funktion. Die 
Bussysteme k6nnen jeden Teilbus frei verschalten und unabhangig routen. Die 

10 Bussysteme und insbesondere die Busknoten verarbeiten und/oder verknupfen die 
Handshake-Signale der einzelnen Busse unabhangig ihres Routings, ihrer 
Anordnung und Sortierung nicht. 

Bei in einer PAE eingehenden Daten werden die Steuersignale samtlicher n 
Teilbusse derart miteinander verknUpft, dass ein allgemeingttltiges 

15 Steuersignal quasi als Bus steuer signal fur den Datenpfad generiert wird. 
Beispielsweise konnen in einer "dependend" Betriebsart RdyHold-Stuf en fur 
jeden einzelnen Datenpfad eingesetzt werden und erst, wenn samtliche RdyHold- 
Stuf en anstehende Daten signalisieren, werden diese von der PAE ubernommen. 
In einer "independend" Betriebsart werden die Daten jedes Teilbusses einzeln 

20 in Eingangsregister der PAE geschrieben und quittiert, wodurch der Teilbus 
sofort far eine nSchste Datenttbertragung frei ist. Das Vorhandensein aller 
erforderlichen Daten von alien Teilbussen in den Eingangsregi stern wird 
innerhalb der PAE durch geeignete logische Verknupfung der fur jeden Teilbus 
im Eingangsregister gespeicherten RDY-Signale detektiert, woraufhin die PAE 

25 mit der Datenverarbeitung beginnt. 

Der wesentliche daraus resultierende Vorteil dieses Verfahrens ist, dass die 
SIMD-Eigenschaft von PAEs keinerlei besonderen EinfluS auf das verwendete 
Bussystem aufweist. Es werden lediglich mehr Busse (n) einer geringeren 
30 Breite (b) bentttigt. Die Verschaltung selbst bleibt unbertihrt. Die PAEs 
. verkniipfen und verwalten die Steuerleitungen lokal . Dadurch entfallt der 
zusatzliche Hardwareaufwand in den Bussystemen zur Verwaltung und/oder 
verknupfung der Steuerleitungen. 

35 Figur 11 zeigt einen mBglichen und besonders bevorzugten Aufbau einer 

Busstruktur fur VPU-Architekturen. Die Ausgabeschaltung einer Funktionszelle 
z. B. (PAE , FREG/BREG) (1103, entspricht 0803a, b) ist uber einen vertikalen 
Bus mit dem horizontalen Bussystem (1102, entspricht 0105) verbunden. 
Entsprechend greifen die Eingabeschaltungen der Funktionszellen (1101, 

40 entspricht 0801, 0802) Uber einen vertikalen Bus Inf ormationen von dem 

horizontalen Bussystem ab. In der Figur wird nunmehr verdeutlicht, wie ein 
derartiger Abgriff , bzw eine derartige Aufschaltung erfolgen kann. 
Wie in Fig. 11a dargestelXt erfolgt das Aufschalten eines Ausgabebusses 
(1111) von 1103 auf 1102 durch ein "Auf trennen" eines Busses des horizontalen 

45 Bussystems 1102 und das Einfugen von horizontalen Schaltem (1112), die durch 
Switches, Transmission-Gates, Multiplexer oder ahnlichen geeigneten 
Bauelementen realisiert sein k5nnen. Abhangig von dem Wert eines Dekoders 




Akte: PACT31PCToe 



und/oder Konf igurationsbits (angedeutet durch das Schalter symbol 1113), das 
entsprechend der bekannten Konf igurat ions verfahr en bevorzugt in einem 
Konfigurationsregister der PAE angeordnet ist und konf iguriert wird, 
verbindet der Schalter entweder die beiden Halften des horizontalen Busses 
5 1102 miteinander oder schaltet den Bus 1111 auf die eine Haifte von 1102 auf, 
die andere Haifte von 1102 ist dann unterbrochen und wird nicht 
weitergeleitet. Die Schaltung wird bevorzugt fur jeden Bus des horizontalen 
Bussystems verwendet. 

Figur lib zeigt die entsprechende Schaltung zum Abgrif f von Daten von 1102 

10 und zur Weiterleitung derer an 1101. Ober vertikale Schalter (1122), die 
durch Switches, Transmission-Gates, Multiplexer oder ahnlichen geeigneten 
Bauelementen realisiert sein kannen, werden Daten bitweise von den Bussen des 
horizontalen Bussystems (1102) abgegriffen und auf den vertikalen Eingangsbus 
(1121) zur Eingabeschaltung 1101 ubertragen. Die Ansteuerung der vertikalen 

15 Schalter, d.h. ihre Schaltfunktion, erfolgt durch Dekoder und/oder 
Konf igurationsbits (angedeutet durch die Schaltersymbole 1123), die 
entsprechend der bekannten Konf igurat ions verfahr en bevorzugt in 
Konfigurationsregistem der PAE angeordnet sind und konf iguriert werden. 
Fig. lib und bei entsprechender Modifikation auch Fig. 11a lassen n:l 

20 Datentibergange zu, d.h. mehrere Busse kannen zu einem Bus zusammengefafit 
werden, d.h. die Daten mehrer Busse werden auf einem Bus zusammengefuhrt. 
Fig. 11c zeigt die Busauf trennf unktion der horizontalen VPU-Bussysteme 
(1102) . tfeder horizontale Bus einzeln und je fur sich kann an der 
Ausgabeseite der PAE-Kante aufgetrennt werden. Eine Auf trennung kann durch 

25 Multiplexer oder Schalter erfolgen, wie in Figur 11c angedeutet werden soil. 
Je nach Konf igurat ionsbit 1132, das bevorzugt fur jeden Bus des Bussystems je 
einzeln zur Verfugung steht, wird die Datenubertragung auf das 
danebenliegende Bussystem (1131) f reigeschaltet oder unterbunden. 
Typischerweise wird diese Funktion in den Schaltern nach Figur 11a 

30 realisiert, indem die Information des Konf igurationsbits 1132 an die Schalter 
(1112) des danebenliegenden Bussystems (1131) ubertragen wird und 

. entsprechend die Schalter zur Weiterleitung ermachtigt .(enabled) oder. die 

Schalter sperrt (disabled) . 

35 Figur 12a zeigt ein SIMD-Bus system entsprechend Figur 11. Dargestellt ist ein 
vereinfachtes horizontales Bussystem 1102, eine PAE Ausgabeschaltung 1103 und 
eine PAE Eingabeschaltung 1101. Jede Eingabeschaltung weist beispielhaft 2 
Eingabebusse der Breite 32 bit auf (1201, 1202), jede Ausgabeschaltung 2 
entsprechende Ausgabebusse (1203, 1204). Jeder der Busse (1201, 1202, 1203, 

40 1204) ist in 4 Teilbusse zu je 8-bit aufgeteilt, die wie dargestellt jeweils 
unterschiedlich und unabhangig geroutet werden kannen, einige der Teilbusse 
werden nicht verwendet (gepunktete Linie) . Die flexible Verschaltung wird 
dadurch erreicht, dass die Schalter nach den Figuren lla-c fur jeden Bus 
derart getrennt aufgebaut sind, dass je ein Teilbus von einem Schalter mit 

45 eigener Konf iguration verwaltet wird. Dadurch ist das Bussystem feingranular 
vers chal tbar . 
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Figur 12b zeigt eine SIMD-Datenverarbeitung, bei welcher samtliche Busse 
(1211) dasselbe Handshake (1212) aufweisen. Die Busse werden innerhalb einer 
PAE in die Teilbusse getrennt und in den SIMD-ALUs (1213, 1214) getrennt 
verarbeitet. Die gemeinsamen Handshakes steuern die Ablauf steuerung (1215) 
5 der PAEs an, bzw. werden von dieser generiert. 

Figur 12c zeigt eine SIMD-Datenverarbeitung, bei welcher samtliche Busse 
vollkommen getrennt sind (1221) getrennte Handshakes (1222) aufweisen. Die 
Busse in den SIMD-ALUs (1223, 1224) getrennt verarbeitet. Die getrennten 
10 Handshakes steuern die Ablauf steuerung (1225) der PAEs an/ bzw. werden von 
dieser generiert. 



Einsatz von FPGAs als ALU-Core 
15 In PACT13 ist bereits eine Architektur beschrieben, in welcher anstatt einer 
ALU eine FPGA oder FPGA-ahnliche Struktur in eine PAE integriert wird. Diese 
Struktur wird innerhalb einer PAE gemaS den FPGA Konf igurationsmethoden nach 
dem Stand der Technik konf iguriert, d. h. die erweiterten 

Konfigurationsverfahren nach PACT 02 , 04, 05, 10, 13, 17 finden auf die FFGA- 
20 Struktur keine Anwendung. Dadurch sind Auf wand und Kosten fur die 

Konfigurationssteuerung der vernal tnismafiig kleinen FPGA-Zellen gering. Die 
PAE allerdings, die die FPGArZellen enthalt, verhalt sich gemafi des VPU- 
Konfigurat ions verfahr ens nach den o. g. Schriften. Dadurch- ist die FPGA- 
Struktur in der PAE-Struktur gekapselt und verhalt sich wie ein PAE-Objekt 
25 mit vielen Konf igurationsregistern. 

Dadurch lassen sich auch beliebige Operationen auf ein Array aus FPGAs 
abbilden. GemaS DE 101 35 210.7-53 ist eine Mischung aus ALU-PAEs und FPGA- 
PAEs innerhalb einer VPU mdglich und durchaus sinnvoll. 

30 Es ist anhand des Anwendungsgebietes zu entscheiden, ob ein mehrfacher Satz 
an Konfigurationsregistern fur die FPGA-Zellen sinnvoll ist, da deren Anzahl 
sehr hoch. ist. Gegebenenf alls werden. Konf igurationsregister zum schnellen 
Umkonfigurieren einer FPGA- PAE gemaS DE 196 51 075.9-53 , DE 199 26 538.0 
und insbesondere DE 100 28 397.7 Fig. 18 und 19 als Register-File oder FIFO- 

35 Struktur innerhalb der PAE realisiert und von dort aus in die FPGA-Zellen 
geladen . 

Es hat sich mittlerweile als besonders vorteilhaft herausgestellt , wenn 
innerhalb einer ALU- PAE eine FPGA Struktur der ALU zugeordnet wird, indem die 
40 FPGA-Struktur vor und/oder nach und/oder parallel zur ALU angeordnet wird. 
Bevorzugt ist eine Ausfuhrung in welcher die FPGA-Struktur der ALU 
nachgeschaltet wird. 

Der Vorteil liegt darin, dass nur relativ kleine FPGA- Struktur en verwendet 
werden mttssen, da samtliche arithmetischen Operationen weiterhin in der ALU 
45 ablaufen. Dadurch wird eine besonders hohe Kosten /Performance Effizienz 

erreicht. Urn kleine Wortbreiten zu unterstutzen (4-bit, 8-bit, etc.), bietet 
es sich besonders an, die vorab beschriebenen SIMD-ALUs einzusetzen. 
— 1001 36 
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Durch die Nachschaltung von FPGA-Strukturen hinter einer ALU lassen sich 
insbesondere Correlatoren und PNG-Generatoren besonders effizient aufbauen. 

Der Einsatz von VPU Architekturen bietet sich mi ttlerweile' insbesondere ftir 
5 den Ersatz von ASICs bei mittleren und niederen Sttickzahlen an. Dieses 
Einsatzgebiet der VPU Bausteine weist die Besonderheit auf , dass die 
Applikationsfelder sehr klar definiert sind und haufig nur einige wenige 
Applikationen auf den Bausteinen ausgeftihrt werden. Besonders diese 
Einsatzgebiete benStigen haufig f eingranulare FPGA-Strukturen zur bitweisen 

10 Verarbeitung von Da ten. 

Durch die Limit ierung auf wenige Anwendungen sind hier die m5glichen 
Konfigurationen der FPGAs ebenfalls sehr begrenzt und vorhersagbar . 
Es wurde erkannt, dass es bei spiel sweise insbesondere ftir diese 
Einsatzgebiete lohnend ist, die Rekonf iguration der FPGA-Strukturen von der 

15 schnellen Rekonf iguration der grobgranularen Strukturen abzusetzten. Mit 

anderen Worten werden ftir die FPGAs langsamere (z. B. herkOmmliche serielle) 
Rekonf igurationsverf ahren verwendet, die auSerst kosten- und f lachenef f izient 
realisierbar sind. 

Dazu kann (1) ein vollkommen separates Konf igurationssystem bestehend aus 
20 Bussystem und Konf igurationskontrollern aufgebaut werden, wie dies von FPGAs 
nach dem Stand der Technik bekannt ist. <2) kflnnen die 

Konf igurationsressourcen der VPU Technologie benutzt werden, ohne dass jedoch 
Ressource ftir besondere beschleunigende Massnahmen zur Verftigung gestellt 
werden. Beispielsweise kann der Zugriff auf den FILMO nach DE 196 54 593.5-53 

25 , DE 198 07 872.2 ftir FPGA-Strukturen ausgeschlossen sein, ebenso wie das 

Vorhandensein von Konf igurationsregisters tacks nach DE 100 28 397.7 Oder wie 
nachfolgend beschrieben. Ebenfalls kann die Untersttttzung der schnellen Wave- 
Rekonf iguration nach DE 199 26 538.0 , DE 100 28 397.7 entf alien. Es ist 
etwa moglich, einera FPGA-Array eine PAE zur Umkonf igurierung zuzuordnen. Hier 

30 mufi lediglich die PAE dazu konfiguriert werden, die FPGA-Struktur zu laden, 

was wie vorstehend beschreiben, durch PAE-gesteuerten, eigenstandigen Zugriff 
auf Daten von auSen geschehen kann. 

Insbesondere bietet es sich aus Kostengrtinden an anstatt der mehrfach 
rekonf igurierbaren Architekturen ressourcensparende "einmal konf igurierbare" 

35 Architekturen einzusetzen. Die VPU-Baus teine werden dann einmal vor ihrer 
Auslieferung an den Kunden oder beim Kunden bzw. durch den Kunden 
personalisiert, d. h. die FPGA-Strukturen werden auf ihre durchzuftihrende 
Funktion konfiguriert. Die Funktion der FPGA-Strukturen ist sodann im 
weiteren unabanderlich, wahrend samtliche verbleibenden Funktionen, wie die ' 

40 der ALUs und deren Vemetzung, weiterhin vollstandig 1 auf zeit rekonf igurierbar 
entsprechend der VPU-Technologie ist 

Als "einmal konf igurier bare" Technologien bieten sich besonders die bekannten 
ROM, EPROM, * EEPROM, FLASH basierenden Verf ahren an. Es soli insbesondere 
erwahnt sein, dass sich die bekannten Fuse und Ant i fuse -Verf ahren (z.B. 
45 Atmel, Actel, Quicklogic) besonders zur Realisierung derartiger "einmal 
programmierbarer" FPGA-Strukturen eignen. 
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Auf den prinzipiellen Aufbau derartiger Strukturen soil hier nicht weiter 
eingegangen werden, da dieser durch den einschiagigen Stand der Technik, 
insbesondere den Patenten der o. g. Firmen, hinreichend bekannt ist. 

5 Figur 8 zeigt beispielhaft eine erf indungsgemafie PAE. Dargestellt ist der 
Datenpfad der PAE. Die Verbindung zu dem Bus system 0105 wird durch die 
bevorzugt Register enthaltende Eingabebaugruppe 0801 und 0802 und die 
ebenfalls bevorzugt Register enthaltende Ausgabebaugruppe 0803 realisiert. 
Der ALU (0804) nachgeschaltet ist eine Funktionseinheit aus f eingranularen 

10 FPGA-Zellen (0805), die ttber einen Busstruktur miteinander verbunden sind. 
Der Ausgang von 0804 wird auf diese Busstruktur aufgeschaltet , die 
• Busstruktur wiederum ist mit 0803 verschaltet. Optional und bevorzugt kann 
mittels eines Multiplexers ein Bypass des Ausgangs von 0804 direkt auf die 
Ausgabebaugruppe 0803 an 0805 vorbei geschaltet werden. 

15 In die FPGA-Zellen kSnnen mehrere Stufen Logik konfiguriert werden, 

insbesondere samtliche oder einige der folgenden Funktionen: Multiplexer, 
AND, OR, XOR, NOT Funktionen, Halb- addierer, Vergleicher, Schieberegister , 
Register, Boolsche Lookup-Tabellen. 

Die FPGA-Zellen (0805) kdnnen durch den Konf igurationsbus (0404) der PAE 
20 konfiguriert werden. Bevorzugt werden besondere konf igurationsbeschleunigende 
Baugruppen, wie z. B . Konf igura t ions stacks (0406) nicht zur Konf iguration von 
FPGA-Zellen benutzt. Diese. Baugruppen werden ggf . far derartige 
Konf igura tionsda ten passiv geschaltet oder die Konf igurationsdaten werden an 
ihnen vorbeigeleitet . 

25 In einer besonderen Ausgestaltung ist eine permanente einmalige Konf iguration 
der FPGA-Zellen unter Verwendung von ROM-Elementen wie z. B. EPROM, EEPROM, 
Flash-ROM oder Fuse-/Antifuse-Technologien vorgesehen. 

Figur 9 zeigt mSgliche erf indungsgemafce Ausgestaltungen von PAEs. Es soli 
30 ausdrucklich darauf hingewiesen werden, dass die Ausgestaltung in Figur 9a 
und die in Figur 9b auch gleichzeitig zusammen in einer PAE implementiert 
sein kc-nnen. • • - 

Figur 9a zeigt den AnschluS eines Registerf iles (0901) (z.B. R0..Rn) an einen 
35 Kern (0902), der beispielsweise aus einer ALU wie 0804 oder einer ALU (0804) 
und FPGA-Zellen (0805) bestehen kann. 

Die Ergebnisdaten des Kerns werden zu den Registem 0901 geftihrt und dort je 
nach Operation eingespei chert . Die Register 0901 werden uber Muliplexer 
(0903, 0904) je nach durchzufuhrenden Operation auf die Eingange der ALU 
40 geftihrt. 

Figur 9b zeigt eine ahnliche Struktur, bei welcher eine zusatzliche 
Aufschalteinheit (0911) fur einen dedizierten globalen Bus (0912) (z.B. IO- 
Channel) implementiert ist. Die Ergebnisdaten des Kerns werden zu der 
45 Aufschalteeinheit 0911 geftihrt und dort je nach Operation auf den globalen 
dedizierten Bus (0912) tlbertragen. Fur die PAE bestimmte Daten von 0912 
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werden tiber Muliplexer (0903, 0904) je nach durchzufuhrenden Operation auf 
die EingSnge der ALU geftihrt. 

Optional kann die Auf schalteeinheit 0911 tiber die Busauf schalteeinheiten 0913 
und 0914 Daten direkt von dem Bussystem 0105 lesen oder auf dieses 
5 ttbertragen . 

Figur 10a zeigt die Verwendung von dedizierten globalen Bussystemen innerhalb 
eines Arrays aus PAEs (1001) . Insoweit entspricbt die Darstellung des PAs aus 
Figur 1 (0101) . Jeweils eine Menge von PAEs (1001) ist an die globalen 
dedizierten Bussysteme 1002, 1003, 1004 angeschlossen und kann Daten auf 
diese Senden Oder von diesen Empfangen. Die Datentibertragung kann sowohl 
zwischen den PAEs, als auch zwischen PAEs und IO stattfinden. Es ist 
dargestellt, dass PAEs auch an mehrere globalen dedizierten Bussysteme 
gleichzeitig angeschlossen sein kennen, wahrend andere PAEs moglicherweise 
15 keinen Anschluss aufweisen. 

Figur 10b zeigt beispielsweise den Anschlufi eines globalen dedizierten Busses 
(beispielsweise 1002 oder 1003 oder 1004) . der innerhalb des Arrays aus PAEs 
(0101) mit einigen PAEs (1001) verbunden ist, an aufierhalb des 0101 liegende. 
ggf . auch bausteinexteme Baugruppen. Die Baugruppen kSnnen beispielsweise 
Peripherie (1011) und/oder Speicher (1012) sein. Zum Anschlufi der aufierhalb 
liegenden Baugruppen (1011, 1012) kann ggf. eine Anpassung der Signale (z. B. 
Spannungen: CMOS, TTL, DVDS, etc.) stattfinden. 

Figur 10c zeigt ein Beispiel fur den Anschlufi eines globalen dedizierten 
Busses (beispielsweise 1002 oder 1003 oder 1004) , der innerhalb des Arrays 
aus PAEs (0101) mit einigen PAEs (1001) verbunden ist, an eine Interface- 
Baugruppe (1021) . Die Interf ace-Baugruppe tibersetzt die Protokolle und/oder 
Signale des internen dedizierten Busses auf einen oder mehrere aufierhalb 
liegenden Busse. In dem aufgezeigten Beispiel sind 2 aufierhalb liegende Busse 
(1022, 1023) implementiert. Die Bussysteme sind bevorzugt unterschiedlicher 
Ausgestaltung, beispielsweise kann 1022 ein Speicherbussystem fur Speicher 
(1024) wie SDR-RAMs, DDR-RAMs, RAMBUS o.a. sein, wShrend 1023. ein 
Peripheriebussystem fur Peripherie- und/oder IO-GerSte (1025) darstellt, wie 
z. B. PCI Oder ein serielles Protokoll wie USB, FireWire, Ethernet. 
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Konfiouration k omolexer Rpchenwerke 

Komplexe Rechenwerke (z. B. Floating-Point Rechenwerke) kOnnen durch die 
geeignete Verschaltung und Gruppierung von konf igurierbaren Zellen (PAEs) 
meglicherweise auch unterschiedlicher Bauart (RAM- PAEs , ALU-PAEs, Bussen) 
realisiert werden. 

Beispielsweise kann ein Floating-Point Rechenwerk durch eine geeignete 
Verschaltung von mehreren ALU-PAEs , die die arithmetischen Operationen ttber 
Exponent und Mantisse durchftlhren erreicht werden. Bevorzugt werden den ALU- 
PAEs die in der VPU des Anmelders (XPP-Technologie) integrierten Forward- und 
Backward-Register (FREG/BREG) zugeordnet, urn die notwendigen Normierungen 
durch schiebeoperationen der in den FREG/BREG angeordneten Barrel-Shifter 
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durchzuftthren. Dainit lassen sich Floating-Point Rechenwerke bei Bedarf auf 
Basis der Integer-ALUs mit hoher Flachenef f izienz aufbauen. 

Ein Vorteil des Verfahrens liegt darin, dass keine silizium-Fiache fur fest 
integrierte Floating-Point Rechenwerke verwendet werden muss. Da Floating- 
5 Point-Operationen relativ zu den Integer-Operationen nur selten gebraucht 
wird, steigt damit das Kos t en /Nut z en -Verbal tnis erheblich an. 
Compiler, die Hochsprachenprogramme auf eine VPU tibersetzen, k6nnen durcb 
Makroexpansion und/oder mittels Lauf zeit-Bibliotheken entsprechende 
vorgef ertigte komplexe Strukturen in den Maschinencode (z. B. NML) 
10 ubernehmen . 

Fur Maschinencode-Programme (z. B. NML) bieten sich besonders Library-Calls 
auf Bibliotheken an, die die entsprechenden komplexen Funktionen vorgefertigt 
en thai ten. 

15 

Staternachines liber RAM-PAEs 

Mit einem Array aus PAEs verbundene RAM-PAEs kOnnen zum Aufbau von Sequenzern 
eingesetzt werden. Das Grundprinzip beruht darauf , dass Ausgangsdaten eines 
Speichers auf dessen Adresseingang zuriickgekoppelt wird. Die Ruckkopplung 
20 erfolgt bevorzugt uber ein taktgesteuertes Registers. Dadurch entsteht ein 
Sequenzer, dessen jeweils nachf olgender Zyklus durch den jeweils aktuellen 
Zyklus vorgegeben ist. 

Teile der Ausgangsdaten ( CONTROL- Signale) kannen nunmehr an andere Baugruppen 
und/oder Funktionszellen (PAEs) und/oder auch an externe Gerate ttbertragen 

25 werden, urn dort bestimmte Vorgange auszulbsen. Besonders bevorzugt sind zwei 
Obertragungsarten, die zuioeist gemeinsam angewendet werden: 
a) die ttbertragung Uber einen Datenbus, bevorzugt inbesondere als SIMD-Bus 
gemafi der vorstehenden Eriauterung ausgestaltet, wodurch eine teilweise 
tJbertragung der Ausgangsdaten besonders effizient realisierbar ist. 

30 b) die ttbertragung uber einen Triggerbus, dessen bevorzugte Ausgestaltung und 
Arbeitsweise in PACT 08 beschrieben ist. ttber. Triggerbusse kOnnen Zustande und 
Bedingungen -zur Ablauf steuerung von Baugruppen und/oder Funktionszellen 
(PAEs) und/oder auch externen Geraten besonders effizient ubertragen werden. 

35 Der Aufbau der Eingangsadressen, bzw. Ausgangsdaten ist wie 
folgt (Darstellung: h6herwertige Bits ... niederwertig Bits): 
Adresse: 



lAdresse des aktuellen Zyklus 



Da ten : 



lAdresse des nachsten Zyklus 



CONTROL-Signale 



40 



Es bleibt zu erwahrien, dass die Eingangsdaten typischerweise nicht verwendet 
werden, d.h. auf den Speicher wird nur lesend, nicht schreibend zugegriffen. 
Der Inhalt des Speichers (z.B. RAM-PAE) wird durch eine Konf igurationseinheit 
vorkonf iguriert. Deshalb kann der Speicher insbesondere auch als 
45 nichtf lttchtiger einmal programmierbarer Speicher mit ROM, EPROM, EEPROM, 

40 
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Flash Zellen oder basierend auf Fuse Oder Antifuse TechnoXogien aufgebaut 
sein. Der Speicher wird dann, wie vorab bereits beschrieben, vor der 
Auslieferung an den Kunden oder beim Kunden personal is iert, d.h. 
programmiert . 

5 

Ein Speicherzugriff durch andere PAEs ist grundsatzlich mSglich, urn den 
Sequenzer z.B. im Betrieb zu modif izieren, soil aber aufgrund des begrenzten 
Einsatzbereichs hier nicht weiter detailliert ausgeftthrt werden. 

10 Der erfindungsgemaSe Sequenzer kann durch folgende Erweiterungen in seiner 

Abfolge von Zyklen auf Ereignisse reagieren und insbesondere bedingte Sprunge 
durchf Uhren : 

Ein Teil, bevorzugt der niederwertige, der Eingangsadressen zu dem Speicher 
wird als Eingang fur weitere Zustandssignale verwendet. Diese Zustandssignale 

15 kSnnen durch die vorstehenden overtradings art en ubertragen werden und somit 
Daten oder Trigger sein. Bei der Selektion des nachf olgenden Zyklus wird 
nunmehr eine mogliche Menge von Zyklen durch die Datenrtickkopplung auf die 
bevorzugt hohen Adressbits bestimmt und der bestimmte Zyklus wird dann aus 
der moglichen Menge durch die Zustandssignale auf den niederen Adressbits 

20 selektiert. 

Daraus resultiert folgender Aufbau der Eingangsadressen, bzw. Ausgangsdaten 
wie folgt (Darstellung: hOherwertige Bits ... niederwertig Bits): 
Adresse: 

Zustandssignale 



Adresse des 
aktuellen Zyklus 



Daten : 
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(Adresse des nachsten Zyklus 



CONTROL-Signale 



Somit ist ein vollwertiger Sequenzer definiert, der den Grundprinzipien der 
Mealy-Moore Sequenzern entspricht. 



Die Zustandssignale und/oder Control- Signale kannen nunmehr ggf . zu Bttndeln 
zusammengefaSt derart gruppiert werden, dass je eine Gruppe bestimmten 
Sendern/Empfangem zur Verfugung stent, z.B. eine Gruppe fur 0101-mteme 
PAEs und eine Gruppe fur externe Baugruppen und eine Gruppe zur 
35 Konf igurationseinhei t . 

Mit anderen Worten werden samtliche Sprunge durch die Angabe der "Adresse des 
nachsten Zyklus" realisiert. Bedingungen werden durch die Zustandssignale 
realisiert . 



Das dabei auftretende Problem ist, wie sog. don N t cares, also bestimmte 
Zustandssignale, deren Wert zu einem Zyklus bedeutungslos ist, behandelt 
werden. Die bevorzugte Variante liegt darin, fur samtliche magi ichen Werte 
dieselben Daten festzulegen. 
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Bei spiel: 

Innerhalb einer f olgenderiaassen aufgebauten Adresse 



Adresse des ^ Zustandssignale 

aktuellen Zyklus 

soli die "Adresse des aktuellen Zyklus" (Cycle) beispielhaft gleich 0x60, 
entsprechend CYCLE60 sein. Es sind 4 Zustandssignale (ZSO.. 3) vorgesehen, von 
denen innerhalb des beispielhaf te Zyklus' 2 (ZS3 und ZS1) ije nach Wert zu 
anderen Sprungzielen fuhren, also beispielhaft nach CYCLE10, CYCLE7, CYCLE89, 
CYCLES 6. 

Die Tabelle sieht nunmehr wie folgt aus: 



Adresse 


Daten 


Cycle 


ZS3 


ZS2 


ZS1 


ZSO 




CYCLES 0 


0 


? 


0 


? 


CYCLE10 


CYCLES 0 


0 


? 


1 


? 


CYCLE7 


CYCLE 60 


1 


? 


0 


? 


CYCLE89 


CYCLE60 


1 


? 


1 


? 


CYCLES 6 


Die don't cares (ZS2 , ZSO) werden nunmehr so ) 
Signales keinen EinfluS auf die Zuordnung der 


Adresse 


Daten 


Cycle 


ZS3 


ZS2 


ZS1 


ZSO 




CYCLE60 


0 


0 


0 


0 


CYCLE10 


CYCLE60 


0 


0 


0 


1 


CYCLE10 


CYCLE60 


0 


0 


1 


0 


CYCLE7 


CYCLE 60 


0 


0 


1 


1 


CYCLE7 


CYCLE60 


1 


0 


0 


0 


CYCLE 8 9 


CYCLE60 


1 


0 


0 


1 


CYCLE89 


CYCLE60 


1 


0 


1 - 


0 


CYCLES 6 


CYCLE60 


1 


0 


1 


1 


CYCLES 6 


CYCLE60 


0 


1 


0 


0 


CYCLE10 


CYCLES 0 


0 


1 


0 


1 


CYCLE10 


CYCLE60 


0 


1 


1 


0 


CYCLE7 


CYCLE 60 


0 


1 


1 


1 


CYCLE7 


CYCLE 60 


1 


1 


0 


0 


CYCLE89 


CYCLES 0 


1 


1 


0 


1 


CYCLE89 


CYCLE 60 


1 


1 


1 


0 


CYCLES 6 


CYCLE60 


1 


1 


1 


1 


CYCLES 6 



Jeder Zielzyklus ist nunmehr 4-fach gespeichert, entsprechend alien binaren 
KombinationsmSglichkeiten der don't care. 

Eine weitere optionale, aber sinnvolle und daher bevorzugte 
20 Ausgestaltungsmaglichkeit des Sequenzers sieht einen zusatzlichen Teilbereich 
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der Ausgangsdaten fUr eine Selektor- und/oder Vergleichsmaske fur die 
Zustandssignale vor. Bei der Verwendung als Selektor kdnnen z.B. durch die 
Ansteuerung von Multiplexern durch die Selektormaske eine Teilmenge von 
Zustandssignalen aus mehreren mfcglichen ausgewahlt werden. Die zusatzliche 
5 optionale Vergleichsmaske kann als Vergleichsoperator far einen Vergleicher 
dienen, der entsprechend ein Statusbit (gleich/nicht gleich) aus einer Menge 
von Statusbits generiert. Ebenfalls kann die Vergleichsmaske zur Deselektion 
von don't care Signal en dienen, z.B. uber eine normale Maskenoperation durch 
Verundung nach dem Stand der Technik (siehe PACT10) . 

10 

Der Aufbau der Ausgabedaten ist dann wie folgt: 



Daten: 



15 



20 



25 



Adresse des nachsten 


CONTROL- Signale 


Selektor /Vergleichsmaske 


Zyklus 







Ein bevorzugter Sequenzer kann beispielsweise wie folgt aufgebaut sein: 
Der Adressbus einer RAM-PAE, die als Sequenzerspeicher verwendet wird, wird 
in mehrere Teiladressen beliebiger und insbesondere mdglicherweise auch 
unterschiedlicher Breite aufgeteilt, beispielsweise Bit 0..3 fur eine erste 
Teiladresse (NEXT_CYCLE) , Bit 4.. 7 fur eine zweite Teiladresse .(SEQ_IN) und 
Bit 8.. 12 fur eine dritte Teiladresse (CTRL_IN) . 

Der Datenausgang einer RAM-PAE wird in mehrere Teildaten beliebiger und 
insbesondere mSglicherweise auch unterschiedlicher Breite aufgeteilt, 
beispielsweise Bit 0..3 fur die ersten Teildaten (CYLCE) , Bit 4.. 7 fur die 
zweiten Teildaten (SEQ_OUT) und Bit 8.. 12 fur die dritten Teildaten 
(CTRL_OUT) . 



Zur Auf teilung der Adressen und/oder Daten kann insbesondere das beschriebene 
SIMD PAE- und Bus-Konzept verwendet werden. Weiterhin kann die Auftrennung 
30 innerhalb der RAM-PAE erfolgen. . . ...... 



Der RAM-PAE k5nnen datenverarbeitende PAEs zugeordnet werden, wie z. 
PAEs. 



B. ALU- 



35 Die Festlegung des nachsten Zyklusses innerhalb eines sequenzerdurchlauf s 
erfolgt durch die Ruckkopplung von NEXT_CYCLE auf CYCLE. 



In einer erweiterten Ausf uhrungsvariante kdnnen zusatzliche 
datenverarbeitende PAEs zur Berechnung von CYCLE in Abhangigkeit von 
40 NEXT_CYCLE innerhalb der Ruckkopplung vorgesehen sein. Diese PAEs kdnnen auf 
beliebige, insbesondere auch zusatzliche Signale, Daten oder Zustande 
anderer PAEs und/oder externer/ peripherer Baugruppen reagieren. Desweiteren 
kdnnen diese PAEs zusatzliche Signale oder Daten erzeugen. 
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Zur Realisierung eines erweiterten Sequenzers kdnnen weitere PAEs angekoppelt 
sein, die in einer mSglichen Ausgestaltung auch in ihrer Funktion und/oder 
Vemetzung vom Sequenzer beeinflufct werden ki3nnen. Dazu kann der Sequenzer 
Daten in die Konf igurationsregister der entsprechenden PAEs ubertragen . . Ein 

5 Zugriff auf die Konf igurationsregister kann beispielsweise durch die in DE 
197 04 728.9 beschriebene Architektur erfolgen (vgl . DE 197 04 728.9, Fig. 
4). Die angekoppelten PAEs verarbeiten vorwiegend Daten beliebiger Art und 
besitzen AnschluE an weitere PAEs, insbesondere datenverarbeitende (ALU- PAEs) 
und/oder Speicher-PAEs (RAM- PAEs) und/oder periphere Anschlusse (IO-PAEs) . 

10 Diese PAEs kc-nnen durch die durch SEQ_OUT dargestellten Control-Signale 
angesteuert werden und kOnnen bedarfsweise durch die an SEQ_IN geleiteten 
Zustandssignale- Ablauf speicher des Seguenzers ansteuern. 

15 Weitere mdglicherweise auch unabhangige PAEs oder Einheiten, insbesondere 

auch externe/periphere Einheiten und/oder tibergeordnete CTs kc-nnen durch den 
Sequenzerspeicher entsprechend SEQ_IN/OUT angesteuert werden <CTRI,_OUT) oder 
diesen ansteuern (CTRI*_IN) . 



20 



Zur korrekten taktgesteuerten Ablauf steuerung des Sequenzers sind in 
Rtickkopplungspfade bevorzugt taktsynchronisierte Register eingebaut. 



Die RAM-PAE kann durch eine tibergeordnete Konf igur at ions einheit konf iguriert 
25 werden, insbesondere k6nnen die Sequenzerf unktionen durch den Inhalt der RAM- 
PAE konfiguriert und festgelegt werden. 

Es wurde als vorteilhaf t erkannt und wird fur sich als patentfahig gehalten, 
dass mit einem Speicher ein einfacher Sequenzer ohne grofien zusatzlichen 

30 Hardwareaufwand realisiert wird. Dies ist besonders leicht dadurch mdglich, 

dass zunachst der Inhalt einer Speicherzelle dahingehend ausgewertet wird, an 
welcher Stelle als nachstes ein Lesezugriff erfolgen soli. Wenn dort wieder 
angegeben ist, wo als nachstes ein Zugriff erfolgt, ist ein automatenartiges 
Durchlaufen realisierbar . Zugleich wird aber gemafc der hier als vorteilhaf t 

35 erkannten Ausgestaltung nicht einfach eine weitere Adresse fttr den nachsten 

Zugriff ermittelt, sondern parallel dazu angegeben, was dabei zu tun ist; mit 
anderen Worten werden an der Speicheradresse auch Daten oder Befehle 
mitabgespeichert. Dies kann dadurch geschehen, dass ein Teil der an einer 
Stelle gespeicherten Information die Adresse fur den nachsten Zugriff angibt 

40 und ein weitere Teil einen Befehl oder Daten darstellt. Dies ist ohne 

weiteres moglich, wenn die Breite der gespeicherten Daten aufgeteilt wird in 
einen Adressanteil und einen Daten/Bef ehlsanteil . Weiter ist es sogar 
meglich, nur einen Teil der im Speicher adressierbaren Speicherplatze zu 
kodieren, etwa bei 12 bit Breite nur 8 bit zu verwenden. Dann k6nnen weitere 

45 Bits hinzugefugt werden, hier vier, etwa durch Auswertung von Flags, 

Triggern, Zustanden, tiberlaufen etc. Dies hat den Vorteil, dass an die^ 
Speicherstellen, die dann exakt angesprochen werden durch Vorgabe der hier 
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8bitigen ausgelesenen Adresse und der hier 4bit auswertegenerierten 
Information, unterschiedliche Anweisungen gesetzt werden kdnnen. Es sei 
darauf hingewiesen, dass entweder alle Trigger und die erf orderliche Reaktion 
hierauf von vorneherein festlegbar sind oder dass alternativ auch zumindest 
5 Teile der Reaktionen auf einzelne oder alle Trigger wahrend der Ausfuhrung 
einer Konf iguration variiert und/oder festgelegt werden konnen. Hierzu kann 
eine Ruckkopplung auf eine Triggermaskierung usw. vorgesehen sein. 

Dies erlaubt es, abhangig von den ausgewerteten Inf ormationen bedingte 
10 Sprunge etc. zu generieren. Sind dabei von einer Reihe per- se auswertbarer 

Inf ormationen nur wenige interessant, werden also aktuell im obigen Beispiel 
etwa nur 2 statt vier Bits benOtigt, so kann die jeweils in einer 
entsprechenden Speichers telle angegebene Information an jenen Speicherstellen 
auch vorhanden sein, die sich nur um nicht interessierende Bits in ihrer 
15 Adresse unterscheiden. 

Figur 15 zeigt ein Ausgestaltungsbei spiel eines erf indungsgemaSen Sep^ienzers 
basierend auf einer RAM-PAE. Ein Teil (1505) des Datenausgangs (1502) eines 
Speichers (1501) ist ttber ein taktgesteuertes Register (1503) auf den 
20 Adresseingang (1504) des Speichers zurttckgekoppelt . Der Adresseingang (1504) 
entspricht somit CYCLE und 1505 einem Teil, bevorzugt dem H8herwertigen, v.on 
NEXT__CYCLE. 

Optional kann ein Teil (1508) des Datenausgangs (1502) an eine Selektor- 
25 Maskeneinheit (1509, 1510) gefuhrt werden, in welcher die vom Bussystem 0105 
als Daten und/oder Trigger eingehenden SEQ_IN (1511) bzw. CTRIi_IN (1512) 
Da ten verarbeitet werden. 

CTRL_IN und SEQ_IN und/oder deren in der Selektor-Maskeneinheit verarbeitete 
30 Werte werden zu 1505 dazugemischt (1513), bevorzugt derartv dass 1505 den 
hOherwertigen Adressteil und CTRL_IN/SEQ_IN den niederwertigen bilden. 

Der verbleibende Teil des Datenausgangs (1502) kann in einen SEQ_OUT- (1506) 
und CTRL_OUT (1507) Teil aufgetrennt werden und ttber die Ausgabebaugruppen 
35 0803a,b als Daten und/oder Trigger auf das Bussystem 0105 gefuhrt. 

Verschiedene Konf igurationsregistermodelle zur Festlegung der Konf iguration 
von jeweils lokal zugeordneten PAEs sind bekannt. In PACT02 ist ein 
sequentiell abarbeitbares Modell beschrieben, in PACT 04 ist ein FIFO-Modell 
40 beschrieben, das ebenfalls sequentiell abgearbeitet und ttberlappend 

konfiguriert werden kann, in PACT 08 ist ein selektives Modell beschrieben, 
bei welchem abhangig von der Datenverarbeitung bestimmte 

Konfigurationsregister und damit die in ihnen gespeicherte Funktion und/oder 
Vernetzung ausgewahlt werden. In DE 100 28 397.7 ist weiterhin ein FIFO- 
45 Modell beschrieben, das sich besonders fur die Vorabkonf iguration und 
uberlappende Konf iguration eignet. 
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Als besonders leistungsfahig und Kosten/Perf ormance effizient wurde eine 
Mis chung aus dies en Model 1 en erkannt. 

Das FIFO-Modell nach DE 100 28 397.7 eignet sich besonders, um eine 
5 beliebige Anzahl von Konf igurationsregistem von PAEs vorzuladen, da die 
Funktion des verwendeten FIFOs eine variable Konf igurationslange effizient 
ermoglicht. Hierzu wird jeder PAE ein lokaler FIFO-Speicher zugeordnet, der 
die Konf igurationen seiner zugeordneten PAE verwaltet und puffert. 

10 Durch eine Erweiterung, wie z. B. die nachfolgend beschriebene, des FIFO- 

Modelles kann der Anf ang und das Ende einer bestimmten Konf iguration und der 
dazugehorenden einzelnen Konf igurationseintrage festgestellt werden. Nunmehr 
k6nnen mehrere Konf igurationen zugleich in dem FIFO-Modell abgelegt werden. 

15 Als besonders geeignet zur Kennzeichnung des Anfangs oder Endes von 

Konf igurationen haben sich die zwei nachfolgend beschriebenen Verfahren 
herausgestellt : 

a) Kennzeichnung durch zusatzliche Bits (CycleBits) in jeder Speicherzelle: 
20 Jedem Konf igurationseintrag werden zusatzliche Bits zugeordnet, die den 

Beginn und/oder das Ende einer Konf iguration kennzeichnen. Beispielsweise 
kann ein Eintrag im FIFO wie folgt aussehen:- 



Bit 0. .15 


Bit 16 


Bit 17 


Konf igurationswort 


0=don' t 


0=don'-t 




care 


care 




l=Beginn 


l=Ende 


Da bevorzugt nach dem nachfolgend beschriebenen Verfahren direkt auf den 


Beginn von Konf igurationen gezeigt werden kann, .wird bevorzugt auf 


die 


Anzeige des Beginns verzichtet: 






Bit 0. .15 n 


Bit 16 




Konf igur at i onswor t 


0=don' t 






care 






l=Ende 





b) Besonders effizient kann die Kennzeichnung durch besondere 
Konfigurationsworte sein, die als Befehle dekodiert werden: 
30 Bestimmte Bitkombinationen innerhalb des Konf igurationswortes werden als 
Befehle dekodiert und erkannt: 

Beispielsweise kSnnten die folgenden Befehle implementiert sein: 
BEGIN : Beginn einer Konf iguration 
END : Ende einer Konf iguration 
35 Dieses Verfahren ist erheblich flexibler und leistungsfahiger als die 
Kennzeichnung durch CycleBits. 
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Zur einfachen Unterscheidung von Befehlen und Konf igurationen kann ahnlich 
den CycleBits ein Bit vorgesehen sein, das durch seinen Wert die Semantik der 
Konf igurationswortes bestimmt, beispielsweise wie folgt: 



Bit 0. ,15 


Bit 16 


Daten 


(^Interpretation der Daten als 
Konf igurat ions wort 
l=Interpretation der Daten als 
Befehl 



5 Eine Konf igurat ion wird je Aufruf von ihrem Anfang bis zu ihrem Ende in die 
Konf igurat ions register einer PAE tlbertragen. 



Durch eine optionale zusatzliche tibersetzungs- und Zuweisungsvorrichtung 
konnen Zustande (z.B. Zustande der eigenen ALU und/oder ein oder mehrere 
10 Trigger (vgl . DE 197 04 728.9 ) beispielsweise anderer PAEs) auf bestimmte 
Konf igurationen innerhalb des FIFO-Modells ubersetzt werden. Beispielsweise 
kann ein eintref fender Rekonf igurat ions trigger auf eine bestimmte 
Konfiguration innerhalb des FIFO-Modells zeigen, die durch das Auftreten des 
Rekonf igurat ions trigger dann konfiguriert wird. 

15 

Als ubersetzungs- und Zuweisungsvorrichtung ktfnnen beispielsweise 
algebraische Berechnungen und/oder logische Verknttpf ungen und/oder bevorzugt 
Cbersetzungsspeicher (Lookup-Tabellen) zum Einsatz kommen. 

20 Wenn verschiedene Konf igurationen in einer oder far eine oder eine Reihe von 
PAEs abgelegt werden, so bietet es sich an, die Adressen, an denen die 
jeweilige Information abgelegt ist, auf einfache Weise dadurch zu verwalten, 
dass die Langen der jeweiligen abgespeicherten Konf igurationen aufaddiert 
werden. Dies ist dann wichtig, wenn die Konf igurationen unterschiedliche 

25 Langen haben, etwa weil bei bestimmten Konf igurationen Busse und/oder 

Register, wie Vorwarts- und Rttckwartsregister konfiguriert werden mttssen und 
....bei andere-nur neue Funktionen der ALU einer PAE. einzustellen sind,. oder weil 
gleichzeitig Konf igurat ions information fur zellexterne Einheiten mitverwaltet 
wird. 



30 



Dann 



Es ist damit also maglich, einen Quasi-Fif ocharakter zu implementieren. 
sollten Mittel zum Aufaddieren, insbesondere sukzessivem Auf addieren . von 
Konfigurationslangen, sowie dafUr, bei ttberf lUssigwerden bestimmter 
Konf igurationen, etwa aufgrund von Abarbeitung etc., die betreffenden 
35 Bereiche freizugeben. Das Aufaddieren ist etwa problemfrei mit Addiererketten 
moglich. 

Diese Anordnung kann verwendet werden, um in einer Zelle Konf igurationen zu 
verwalten bzw. wiederum einen Sequenzer zu implementieren. Wiederum kann so 
40 auf die Konf igurationen reagiert werden, dass sich Sprunge etc realisieren 

lassen. Es sei darauf hingewiesen, dass oben bereits erwahnt wurde, dass zur 
Realisierung von Sequenzern zwischen ALU- PAEs und/oder anderen 



Akte: PACT31PCToe 



datenverarbeitenden Zellen mit jeweils gegebenen falls erweiterter 
Funktionalitat und Spei'cherzellen Steuer (Command-) Lei tungen vorgesehen werden 
kfinnen. Es sei erwahnt, dass derartige Leitungeii mit zugeordeten Steuerungen 
auch innerhalb einer einzelnen und fiir sich autark seqeunzerf ahigen PAE 
vorgesehen sein konnen . 



Eine besonders bevorzugte Variante ist in Figur 14 dargestellt und arbeitet 
wie folgt: 

10 Eine Kette von Addierern wird derart miteinander verbunden, dass das Ergebnis 
(SUMME) eines vorherigen Addierers (p) an einen nachfolgenden Addierer (p+1) 
als Operand weitergeleitet wird. Die Weiterleitung kann derart unterbrochen 
werden, dass anstatt des Ergebnisses eine 0 (Null) weitergeleitet wird. 
Als zweiter Operand ist jedem Addierer jeweils ein eigenes Registers 

15 zugeordnet, dessen Wert jeweils zur SUMME der vorherigen Stufen addiert wird. 
Jede der Stufen reprasentiert eine Konf iguration im Konf igurations-FIFO; in 
dem Register der jeweiligen Stufe ist die relative Startposition einer 
Konf iguration gespeichert. Die absolute Startposition lafit sich nun 
borechnen, indem sSmtliche relative Startpositionen der sich unterhalb im 

20 FIFO befindenden Konf igurationen aufaddiert werden. Dies geschieht durch die 
Addiererketten, wie auch aus der Fig. Ersichtlich ist. 

Mit anderen Worten ist die relative Position als unterste Konf iguration im 
FIFO diejenige, deren Eintrag am Nachsten zum Ergebnis ausgang der 
25 Addiererkette gespeichert ist.., Sodann folgen alle weiteren relativen 
Positionen gemaS ihrer Anordnung im FIFO. 

Die Kette wird an der Stelle durch einschleusen einer Null anstelle der SUMME 
unterbrochen, bei welcher die relative Position der selektierten 
30 Konf iguration erreicht ist. 

Das Ergebnis ist nunmehr der Offset zwischen dem Lesepointer des FIFOs , der 
auf die unterste Konf iguration .zeigt, und der Startposition der selektierten 
Konf iguration . 

Somit ist die Sprungadresse zur selektierten Konf iguration einfach durch 
35 Addition von Zeiger und Offset berechenbar. 

Die Auswahl der selektierten Konf iguration kann durch unterschiedliche 
Verfahren in der ttbersetzungs- und Zuweisungseinrichtung erfolgen. 
(a) Die eingehenden Trigger kennen priorisiert und dekodiert werden. 
40 (b) Die eingehenden Trigger werden Uber eine Lookup-Tabelle iibersetzt und 
danach maglicherweise priorisiert und dekodiert. 

(c) Es der Menge aller Trigger werden einige ausgewahlt, z.B. Ober 
Multiplexer, die sodann entsprechend (a,b) weiterverarbeitet werden. 

45 Es soli besonders darauf hingewiesen werden, dass ein Trigger auch ein Vektor 
(TRIG-V) sein kann, wie in PACT08 beschrieben. Der Vektor selbst kann zur 
weiteren Dekodierung verwendet werden, d.h. der Vektor selektiert die 
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10 



15 



Konf iguration. Dies ist insbesondere dann wichtig, wenn eine Wave- 
Rekonf iguration nach PACT08 , PACT13, PACT 17 durchgeftthrt werden soil, bei 
welclier bevorzugt ein mit den Daten tlbertragener Trigger-Vektor die nachste 
Konf igurat ion selektiert . 



Nach Oder wahrend der Konf iguration kdnnen Konf igurat ionen aus dem FIFO 
entfemt werden. Bevorzugt wird dabei die Ref erenzierung innerhalb der 
ttbersetzungs- und Zuweisungsvorrichtung entsprechend angepasst. 

Weiterhin kann das FIFO-Modell um das Sequenzer-Verf ahren nach DE 196 54 
846.2-53 (bzw, wie bei den anderen Schutzrechten, ohne separat erwahnt zu 
sein, deren parallele) oder bevorzugt das vorstehend beschriebene erweitert 
werden. Dazu werden beispielsweise Sprunge (GOTO) , sowie zustandsabhangige 
und bedingte Sprunge (WAIT-GOTO, IF-GOTO) eingefuhrt. Sprunge kdnnen durch 
besondere CycleBits reprasentiert werden, oder bevorzugt als Befehle 
implementiert sein. 



Weiterhin kann ein Synchronisationsanzeigeverfahren verwendet werden, das 
20 anzeigt, wann eine bestimmte Konf iguration bzw. ein bestimmter Zyklus des 
Sequenzers beendet ist. Mit anderen Worten kann jeder Zyklus aus mehreren 
Konfigurationseintragen bestehen. Zur Kennzeichnung kann beispielsweise nach 
DE 196 54 846.2-53 ein run/stop-Flag verwendet werden, wobei 'run 1 
zusammengehorende Konf igurat ionseintrage eines Zyklus kennzeichnet und 'stop' 
25 den ersten Eintrag eines nachfolgenden Zyklus; alternativ ist ist die 

Verwendung der vorstehend beschriebenen CycleBits moglich, die zwar eine 
etwas andere Semantik aufweisen, sich aber ansonst gleich verhalten. 

Alternativ oder zusatzlich zu diesen Verfahren konnen auch die ebenfalls aus 
30 den f ruheren Anmeldungen des Anmelders bekannten Befehle WAIT und BEGIN oder 
bevorzugt die vorstehend beschriebenen Befehle BEGIN und END verwendet 
werden. - • 

Durch 'stop' Oder WAIT oder END wird das Ende eines Zyklus . gekennzeichnet , d. 
h. eine Konf iguration ist komplett, kann ausgeftthrt und abgearbeitet werden. 
35 Nach Beendigung der Datenverarbeitung dieser Konf iguration wird der -nachste 
Zyklus ausgefuhrt. 

Die Beendigung kann entsprechend sequentieller Prozessoren durch einen Takt 
(Instruktionssequenzing) definiert sein, und/oder entsprechend des 
40 Datenverarbeitungsprinzips der PACT- Prozessoren (P 44 16 881.0-53 , DE 196 54 
846.2-53 , Konfigurationssequenzing) durch ein Statussignal (z. B. einen 
Trigger) definiert sein. 

Mit anderen Worten wird z.B. kann durch das Eintreffen eines Triggers 'stop' 
45 tibersprungen werden und die nachfolgenden Konf igurat ionen konf iguriert 

werden. Alternativ oder zusatzlich kann der Befehl WAIT eingesetzt werden, 
der auf das Eintreffen eines Triggers. 
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20 



25 



30 



35 



Optional kann ein PIFO nicht nur die lokal zugeordnete PAE ansteuem, sondem 
auch weitere, insbesondere umliegende oder zur selben Konf iguration gehorende 



PAES. 



Optional kann der FIFO auch als eine dedizierte Binheit nach DE 196 54 846.2 
53 ausgestaltet sein. 

Aus f tthrungsbei spiel e : 
10 A) Ein ein tref fender Trigger wird tiber eine Obersetzungs- und 

Zuweisungsvorrichtung auf eine im FIFO liegende Konf iguration (Kl> tibersetzt. 

Die Konf iguration (Kl) wird daraufhin in die PAE konf iguriert . Als Ende- 

Kennung kann beispielsweise ein WAIT-Befehl, ein END-Befehl oder das 

run/stop-Flag dienen. 
15 Ein nachfolgend eintref fender Trigger wird uber eine Obersetzungs- und 

Zuweisungsvorrichtung auf eine andere im FIFO liegende Konf iguration (K2) 

Obersetzt. Diese Konf iguration <K2) wird daraufhin in die PAE konf iguriert . 

Kl und/oder K2 k6nnen nach erfolgter Konf iguration in die PAE aus dem FIFO 

geiascht werden. 

B) Ein eintreffender Trigger wird tiber eine Obersetzungs- und 
Zuweisungsvorrichtung auf eine im FIFO liegende Konf iguration (K3) Ubersetzt. 
die aus mehreren Zyklen (Cyl, Cy2, Cy3a, Cy3b, Cy4) besteht. Der erste Zyklus 
(Cyl) wird daraufhin in die PAE konf iguriert und ausgefOhrt. Als Ende-Kennung 
kann beispielsweise ein WAIT-Befehl oder das run/stop-Flag dienen. 
Ein nachfolgend eintreffender Trigger, der das Ausfuhrungsende des Zyklus 
anzeigt, bewirkt die Konf iguration und das Ausftlhren von Cy2 . Cy2 endet mit 
zwei WAIT-GOTO-Befehlen (WAIT-GOTO (Trgl, Cy3a) ; WAIT-GOTO <Trg2, Cy3b) ) 
(vgl. PACT04) , dies bewirkt, dass auf zwei unterschiedliche Trigger, die das 
Ausfuhrungsende des Zyklus anzeigen, Trgl und Trg2 reagiert wird. Trifft Trgl 
ein, wird im nachsten Zyklus Cy3a konfiguriert und ausgefOhrt bzw. bei Trg2 
entsprechend Cy3b. ... 

Cy3a und Cy3b enden mit einem WAIT-GOTO (Trg, Cy4) . Bei eintref fen eines 
Trigger, der das Ausfuhrungsende des Zyklus anzeigt, wird nach Cy4 gesprungen 
und die Konf iguration entsprechend konfiguriert und ausgefOhrt. 

Cy4 endet mit einem WAIT-GOTO (Trg, Cyl), wodurch bei eintreffen des Trigger, 
der das Ausfuhrungsende des Zyklus anzeigt, der erneute sequentielle 
Durchlauf einer Schleife beginnen kann. Insoweit kann durch den Sprung auf 
Cyl ein Ringspeicher nach DE 196 54 846.2-53 zum AusfUhren von Schleifen 
gebildet werden, wobei solch ein Ringspeicher vorteilhaft, aber nicht 
zwingend ist. 

Durch Eintreffen eines Triggers (Trg-x) kann die Schleife terminiert werden. 
Existiert ein Eintrag fur Trg-x in der Obersetzungs- und 

Zuweisungsvorrichtung kann die Schleife jederzeit abgebrochen und die durch 
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Trg-x in der Obersetzungs- und Zuweisungsvorrichtung ref erenzierte 
Konfiguration (KX) ausgeftthrt werden. 

Existiert kein Eintrag, kann durch das explizite Verwenden von WAIT-GOTO 
(Trg-x, KX) Befehlen, z.B. zusammen mit WAIT-GOTO (Trg, Cyl) in Cy4 die 
5 Schleife zu bestimmte vorgegebenen Ausftthrungszeitpunkten terminiert werden. 

Figur 13 zeigt beispielhaft einen Aufbau eines Konf iguratiorisbusses zur 
Konfiguration von PAEs (1001) durch eine Konf igurationseinheit (0106). Die 
Konfigurationseinheit sendet Konf igurationsdaten ttber ein Bussystem 1301 und 

10 ggf . ttber mehrere Registerstuf en (1303. 1304) zur Verbesserung des 

Freguenzverhaltens und Ober den Konf igurationsdatenbus (0404) an die PAEs 
1001. Jede PAE dekodiert die angelegten Adressen und reagiert, sofem sie 
selektiert wurde, auf die DatenUbertragung des Busses. PAEs konnen ihrersexts 
Daten ttber 0404 ttber die Register-Multiplexer-Stuf en 1304 auf das Bussystem 

15 aufschalten und die Konf igurationseinheit oder optional andere PAEs senden. 
Dies geschieht jeweils durch Obertragung der Adresse der Empf angsexnheit. 
Die Rttckttbertragung der Daten an die Konf igurationseinheit erfolgt bevorzugt 
. ebenfalls durch Registerstuf en hindurch (1305), bis zum Dateneingangsbus der 
Konf igurationseinheit (1302) . 

20 Die Funktionsweise des Konf igurationsbusses ist ebenfalls in DE 101 42 904.5 
und DE.100 28 397.7 beschrieben, die zu Of f enbarungszwecken vollumfanglxch 
eingegliedert sind. 

Figur 14 zeigt den Aufbau eines erf indungsgemaSen FIFO-Modells zur Steuerung 
25 der Rekonf iguration; hierbei wird darauf hingewiesen. dass sich insbesondere 
durch die Befahigung zur Durchftthrung von Sprttngen das hier prasentierte 
Fifo-Modell von reinen Fifos aus dem Stand der Technik unterscheiden kann. Es 
wurde dennoch die per se im Stand der Technik belegte Bezeichnung verwendet, 
weil diese vom typischen. sprungfreien Betrieb ein besonders anschauliches 
30 Bild assoziieren laSt. Diese Einheit ist optional zu alien, insbesondere den 
in dieser Anmeldungen beschriebenen, rekonf iguierbaren Zellen (PAEs) und xn 
Figur 4 als Einheit 0406 dargestellt. 

Ein Speicher 1401 enthalt die Konf igurationsdaten fttr die zugeordnete PAE. 
1402 ist der Konf igurationsdatenausgang zu den Konf igurationsregistem der 

35 PAE (0405). uber 1403, d.h. den Bus 0404, schreibt die Konf igurationsexnhext 
Konfigurationen in den Speicher, die jeweilige Adresse wird durch den 
Schreibzeiger (1407) generiert, der pro Schreibvorgang urn den Wert 1 
verandert wird, je nach Arbeitsweise des FIFOs inkrementell oder 
dekrementell. Ein startadress-Pointer (1404) zeigt auf den ersten 

40 Konfigurationsdateneintrag im Speicher, wahrend ein weiterer Pointer (1405) 
auf den zu lesenden, bzw. an die PAE zu ttber tragenden, 

Konfigurationsdateneintrag zeigt. 1405 wird mit jeder Datenttbertragung aus 
dem Speicher an die PAE urn den Wert 1 verandert. je nach Arbeitswexse des 
FIFOs inkrementell oder dekrementell. Die Datenttbertragung findet so lange 
45 statt. bis das Ende der Konfiguration von einer 

Konfigurationsendeerkennungseinheit (1409) erkannt wird. beispielswexse 
anhand eines CycleBits oder Befehls (WAIT, END) . 
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Der realisierte FIFO entspricht nicht den normalen FIFOs nach dem Stand der 
Technik, die nur den Pointer 1405 aufweisen. Die Modifikation ermoglicht das 
. Lesen beliebiger Konf igurationsdaten aus dem Speicher, wahrend durch den 
Pointer 1404 verhindert wird, dass evtl. noch bendtigte Konf igurationsdaten 

5 ttberschrieben werden. Dies geschieht durch das Erzeugen eines Full-Flags 
durch den Vergleich (1406) des Startadress -Pointers 1404 mit dem 
Schreibzeiger (1407). Wenn der Speicher voll ist, werden Schreibversuche der 
Konf igurationseinheit zurtickgewiesen, dies kann bevorzugt durch das aus 
PACT10 bekannte ACK/REJ-Protokoll erfolgen. Der Vergleicher 1406 gibt dazu an 

10 seinem Ausgang 1416 ein entsprechendes Reject-Signal an die 
Konf igurationseinheit aus bzw. gibt kein Ack aus. 

Ein beispielhafter Speicherinhalt von 1401 ist mit 1408 gezeigt. Der Speicher 
enthalt 5 Konf igurationen (C0..C4). 1404 zeigt als Startpointer auf die erste 
15 Konfiguration CO. In diesem Beispiel zeigt 1405 auf den Beginn von 

Konf iguration C3 . Die Zeigerposition berechnet sich aus dem Wert von 1404 
plus der Lange der Konfiguration CO plus der Lange der Konfiguration CI plus 
der Lange der Konfiguration C2 . 

20 Eingehende Trigger (1431) werden Uber eine in Figur 14a dargestellte 

ubersetzungs- und Zuweisungseinrichtung (1432) auf Selekt-Signale (SCO. .n, 
1433) tibersetzt, die die Adressierung der Konf igurationsdaten im Speicher 
steuern. Diese ubersetzungs- und Zuweisungseinrichtung kann fest vorgegeben 
ihre Zuweisung vornehmen, ist aber bevorzugt wahrend der Abarbeitung einer 

25 Konfiguration veranderlich, wozu geeignete Rtickkopplungen , Signal lei tungen 
etc. vorzusehen sind. Besonders wenn die tjbersetzungs- und 
Zuweisungseinrichtung veranderlich ist, wird es bevorzugt, auch und/oder 
zusatzlich die der Zuordnung dienende Einheit 1434 wahrend der 
Datenverarbeitung veranderlich zu gestalten. Auch hierzu sind entsprechende 

30 Schaltungsanordnungen vorzusehen, wobei die Veranderung der Zuordnung 
insbesondere programmgesteuert ablaufen kann. Eine entsprechende, 
insbesondere programmgesteuerte Veranderung ist auch fur die Einheit 1414, 
d.h. das Adressberechnungsadditionskettenmittel moglich. Die diese 
Aktualisierung und/oder neue Verhaltensweisen ausiasenden Befehle werden 

35 bevorzugt in der Speichereinheit 1401 hierfur abgelegt. 

Je ein Register (1411), ein Addierer (1412) und ein Nullgenerator (1413), 
hier beispielhaf t realisiert durch eine bitweise Und-Funktion, bilden ein 
Glied einer Kette (1414) zur Adressberechnung. Je ein Glied verwaltet den 
40 Offset einer Konfiguration. Die Aneinanderreihung der Glieder entspricht der 
Aneinanderreihung der Konf igurationen im Speicher 1401. Mit anderen Worten 
wird entsprechend des Beispiels 1408 das erste Glied die Lange der 
Konfiguration CO aufweisen, also den Offset der auf 1404 addiert werden muss, 
um auf die Konfiguration CI zu zeigen. Das zweite Glied weist die Lange der 
45 Konfiguration Cl auf, also den Offset der auf den Offset von CO und auf 1404 
addiert werden muss, um auf die Konfiguration C2 zu zeigen. Das dritte Glied 
weist die Lange der Konfiguration C2 auf, also den Offset der auf den Offset 
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von CO und auf den Offset von CI und auf 1404 addiert werden muss, urn auf die 
Konfiguration C3 zu zeigen. Und so weiter. 

Es wird anhand der Ausfuhrung ersichtlich, dass eine Kette von Additionen 
entsteht, deren Gliederanzahl der Position der Konfiguration im Speicher 

5 entspricht. Dies wird durch die Kette 1414 wie folgt realisierfe: 

ttber den Addierer wir jeweils der im Register gespeicherte Wert, also die 
Lange der jeweiligen Konfiguration, zu dem Ergebnis des vorherigen Gliedes 
dazuaddiert. Der Wert am Eingang der bitweisen Und-Funktion wird mit alien 
Ergebnisbits des Addierers verundet. 1st der Eingang also gleich 0, liefert 

10 die Und-Funktion eine Binare 0 am Ausgang, urn die Addiererkette bei der 
auszuwahlenden Konfiguration abzubrechen, ansonsten den Wert des 
Addierersaus gangs . 

Mit anderen Worten ist in die Register (1411) die Grofie der Konf igurationen 
15 in ihrer Reihenfolge im Speicher (1401) eingetragen. Die Selektsignale sind 
derart auf die Null -Genera tor en gefuhrt, dass die Konf igurat ions -GrGSen bis 
zur Startadresse der durch die Trigger (1431) ref erenzierten Konfiguration 
auf addiert werden, 

20 Somit addiert die Kette alle Langen von Konf igurationen, die vor der zu 

ladenden Konfiguration im Speicher 1401 liegen. Damit bildet sich ein Offset, 
der durch Addition (1415) mit der Startadresse (1404) auf die zu ladende 
Konfiguration zeigt. 

25 Die beschriebene Schaltung ist besonders leistungsf ahig, da sie die 

Berechnung des Offsets und den Sprung innerhalb eines Taktes ermSglicht. 

In einer zweiten optionalen Kette (1421) kdnnen in Registern (1422) Befehle 
an die Konf igurat ions einheit und/oder die PAE und/oder den 

30 Konf igurationss tack gespeichert werden. Eine Null funkt ion (1423), hier 

ebenfalls beispielhaft entsprechend der Nullfunktion 1413 realisiert, liefert 
eine Binare 0 in an ihrem Ausgang, sofern das Selekt-Signal. nicht aktiv ist, 
d.h. die Konfiguration nicht ausgewahlt wurde, ansonsten den Registerinhalt 
(1422),. also den Befehl. ttber eine Oder-Kette (1424) werden alle Null- 

35 Funktionsausgange miteinander verodert, sodass der Befehl im Register 1422 
der aktuell selektierten Konfiguration am Ausgang (1425) der Kette anliegt. 

Der Befehl kann nunmehr zum Loschen von Eintragen im Speicher (1401) dienen, 
d.h einer der moglichen Befehle kann sein, dass bestimmte gespeicherte 
40 Konf igurationen geloscht werden sollen bzw. zum uberschreiben freigegeben. 
Dies kann z.B. durch den Befehl FLUSH erfolgen, der den Startzeiger (1404) 
mit dem Lesezeiger 1405 ladt und somit alle vor dieser Adresse liegenden 
Daten zum uberschreiben freigibt. Dies ist insofern bevorzugt, als die so zu 
uberschreibenden Konf igurationen im fifoartigen Speicher i.d.R. alter smd 
45 und daher typisch ttberschrieben werden kSnnen, wahrend die jilngeren 

Konf igurationen, die oftmals noch benatigt werden, weiter oben im quasi 
fifoartigen Speicher liegen werden. Ein weiterer bevorzugt implementierter 
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Befehl ist, dass neue Konf igurationen geladen werden sollen; dies ist dann 
wichtig, wenn das Erfordernis, eine bestimmte neue Konf iguration zu 
bendtigen, mit einer zumindest nicht geringen Wahrscheinlichkeit vorhergesagt 
werden kann. Dieser Befehl kann an eine zentrale 
5 Konfigurationsverwaltungseinheit oder dergl . abgegeben werden; die 
Direktladung ist gleichfalls maglich, etwa bei Zuordnung von 1/0- 
M5glichkeiten. Auch ist es bevorzugt, wenn sowohl der 
Konfigurationsanforderungsbefehl als auch der Flush- bzw. 

Altkonfigurationspreisgabebefehl simultan ausfuhrbar und/oder speicherbar 
10 sind. Es sei erwahnt, dass derartige Befehle wie Flush, Laden oder 

Flush/Laden auch in anderen Speicherbereichen bzw. -einheiten wie etwa 1401 
ablegbar sind und dafOr nicht zwingend eine dedizierte Einheit wie 1421^ 
vorzusehen ist. Diese Verwendung einer per se bereits vorhandenen Einheit 
kann hardwaremafiig bevorzugt sein. 

15 

Weiterhin kann der Befehl tiber das Bussystem nach Figur 13 an die 
Konfigurationseinheit gesendet werden (1426). Beispielsweise kann der Befehl 
dort den Start einer bestimmten Konf iguration auslosen und/oder das Vorladen 
einer Konf iguration bewirken. 

20 

FLUSH, also das L5schen von Konf igurationen ist einer der wesentlichen 
bevorzugten Befehle der Einheit. Einerseits ist der Befehl sehr vorteilhaft 
fur die Ausfuhrung, andererseits weist er das Problem auf , dass sich bei 
dessen Ausfuhrung samtliche Adressen und Referenzen verandern. 
25 Der FIFO wird "gef lushed", indem.der StartPointer (1404) auf eine neue 

Startadresse gesetzt wird. Diese wird wie in Fig. 14 dargestellt bevorzugt 
auf den Beginn einer gespeicherten Konf iguration gesetzt, wobei der Beginn 
durch die vorab beschriebene Berechnung mittels des Offsets bestirnmt wird. 
Alternativ oder zusatzlich kann der Zeiger auch auf einen bestiromten anderen 
30 Wert z.B. eine an den FLUSH -Befehle gekoppelte Konstante gesetzt werden. 

Weiterhin mtissen die beiden Ketten 1414 und 1421 «gef lushed" werden, damit 
die Adressberechnung der geanderten Positionen der Konf igurationen im 
Speicher 1401 entspricht. Dies geschieht jeweils durch (in Figur 14 nicht 
eingezeichnete) Multiplexer (1451), durch die die Registerdaten derart 
35 vorwartsttbertragen werden, dass die nunmehr leeren ( "gef lushten- ) Glieder der 
Kette mit den Daten der nachf olgenden Glieder iiberschrieben werden, und zwar 
derart, dass a) die Reihenfolge der Daten in der Kette unverandert bleibt und 
b) das erste Glied der Kette mit neuen Daten belegt ist und c) alle weiteren 
Daten in ihrer Reihenfolge linear und ohne Lucke in die Glieder nachfolgend 
40 dem Ersten geschrieben sind, vgl. hierzu Fig. 14a Es sei darauf hingewiesen, 
dass uber die Multiplexer 1451 auch Daten betref fend die Konf igurationsgrofie 
von auSen an die entsprechenden Stellen (Size of Config l..n) geschrieben 
werden kOnnen. Es ist dabei abzuschatzen, aber aus Grtinden der 
Zeichnungsubersichtlichkeit nicht dargestellt, dass jede Stelle einzeln 
45 ansprechbar bzw. adressierbar ist. Verwiesen wird insoweit auf die in 1434 
dargestellte Einheit 1435, die diese Stelle jeweils bestirnmt. 
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Durch die Verschiebung innerhalb der Ketten sind nunmehr die Selekt-Signale 
(SCO..n) an die neue Lage der Daten in den Ketten anzupassen, damit wieder 
eine korrekte Zuordnung der Selekt-Signale zu der Of f setberechnung exits teht. 
Grundsatzlich stehen dazu mehrere Methoden zur Verfugung. Beispielsweise 
5 k6nnen 

a) Signale nach 1432 in 1434 binar kodiert (entsprechend der Funktion eines 
74LS148) werden, ein Offset, der der durch Flush entstandenen Verschiebung 
entspricht, wird subtrahiert und der entstandene Wert wird wieder dekodiert 
(entsprechend der Funktion eines 74LS139) urn die Selekt-Signale 1433 zu 

10 generieren; 

b) Signale nach 1432 in 1434 mittels eirier Lookup-Tabelle auf die Selekt- 
Signale 1433 tlbersetzt werden, Dazu ist die Lookup-Tabelle der durch Flush 
veranderten Positionslage in den Ketten anzupassen. 

15 Ein besonders bevorzugtes Verfahren fur die Obersetzung der Signale soli 
detailliert beschrieben werden und entspricht der in 1434 eingezeichneten 
Vorrichtung : 

Ein erstes Schieberegister (1435) enthalt als einen Ein-Bit-Wert die Position 
des aktuell ersten freien, also unbenutzten, Gliedes in den Ketten 1414, 

20 1421. Dies geschieht f olgendermafien : Nach einem Reset wird das 

niederwertigste Bit im Schieberegister auf 1 gesetzt ( darges tell t .durch einen 
gef till ten Kreis) . Das niederwertigste Bit (Bit 0) wird auf das unterste Glied 
in den Ketten ref erenziert . Mit jedem Schreibzugrif f auf die Ketten, also mit 
jedem neuen speichern (FILL) einer Konf iguration nach 1401 schiebt das 

25 Schieberegister das gesetzte Bit (PBIT) urn eine Position in Richtung des 

hochstwertigen Bits und referenziert damit auf das jeweils nachfolgende Glied 
in den Ketten. Das hochstwertige Bit referenziert somit auf das hochste Glied 
in den Ketten, also ist das Schieberegister so breit wie Glieder in den 
Ketten vorhanden sind. Mit jedem FLUSH schiebt das Schieberegister das Bit 

30 (PBIT) urn genau so viele Positionen wie Glieder in den Ketten geldscht wurden 
in Richtung des niederwertigen Bits. 

Die tfbersetzungs- und Zuweisungseinrichtung (1432) tlbersetzt bei der PAE vom 
Bussystem (0105a, Fig. 4) eingehende Trigger derart, dass je Trigger ein 
35 genau ein Signal des ausgehenden Busses (1437) gesetzt ist. Jedem Signal ist 
ein Schieberegister (1436) derselben Grafie wie 1435 zugeordnet. Es sind also 
eine Vielzahl von Schiebergi stern 1436 (vorliegend dargestellt 1436a. . .1436c) 
vorhanden, wobei deren Anzahl der Anzahl der maximal zulassigen 
unterschiedlichen Trigger signale entspricht und deren Lange d.h. Bitbreite 
40 der Anzahl der maximal zulassigen Konf igurationen entspricht, also der Anzahl 
der Kettenglieder entspricht. Beim neuen Speichern einer Konf iguration (FILL) 
wird der Inhalt von 1435 vor dem Verschieben von PBIT in das Scheiberegister 
(1436) geschrieben, auf das der, der Konf iguration zugeordnete, Trigger 
zeigt; dargestellt durch einen Kreis. 
45 Bei einem Auf treten des Triggers auf dem Bus lief ert das entsprechende 

tlbersetzte Signal (1437) einen 1-Wert, .wahrend alle anderen Signale einen 0- 
Wert liefern. Die Signale 1437 werden jeweils an Nullgeneratoren (1438), 
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aufgebaut aus einer bitweisen Und-Funktion geftthrt. Alle Nullgeneratoren 
deren Eingangssignal von 1437 einen O-Wert aufweist, liefern einen Nullvektor 
am Ausgang. Der Nullgenerator, dessen Eingangssignal von 1437 einen 1-Wert 
aufweist, ilbertragt den Inhalt des Schieberegisters 1436. Die Ausgange aller 
5 Nullgeneratoren werden miteinander verodert (1439) , sodass die Selekt-Signale 
SCO..n (1433) entstehen. 

Durcb diese Funk ti on zeigt nunmehr ein eingehender Trigger tiber die 
Nullfunktionen auf ein Scnieberegister 1436, dessen gesetztes Bit wiederum 
10 auf ein Glied in der Ketten (1414, 1421) zeigt. 

Bei einem Flush schieben die Scnieberegister 1436 gleich dem Schieberegister 
1435 den gespei chert en Wert urn genau so viele Positionen, wie Glieder in den 
Ketten geiescht wurden, in Richtung des niederwertigen Bits. 1st nach dieser 
15 Operation der Inhalt eines Schieberegisters gleich Null, da das PBIT ttber das 
niederwertigste Bit hinausgeschoben wurde, bedeutet dies, dass die vormals 
referenzierte Konf iguration geldscht wurde. 

Liefert 1434 fur einen eingetrof f enen Trigger 1431 den Wert Null am Ausgang 
20 1433, ist eine Konf igurat ions auf for derung an die Konf igurationseinheit zu 
senden, urn die fehlende Konf iguration zu laden oder ggf. auch ein 
Fehler status an die Konf igurationseinheit zu melden. 

Die ubersetzung der eingehenden Trigger 1431 nach 1437 in 1432 kann nach 
25 mehreren Prinzipien erfolgend, die einzeln oder gemeinsam angewendet werden 
konnen, beispielsweise: 

1 . Dekoder entsprechend der Funktion eines 74LS148 

2. Round-Robin Arbiter (vgl. PACT10) 
3 . Lookup -Tabe lie ( vgl . PACT 1 0 ) 

30 Prinzipiell kann die Obersetzung dem in PACT10 beschriebenen Verfahren 

entsprechen (Round -Robin- Arbiter, LUTl) . 
. . . .Eehlt eine tJbersetzungsvorschrif t, beispielsweise bei der* Anwendung von 

Lookup-Tabellen, ist eine Konf igurationsauf f orderung an die 

Konf igurationseinheit zu senden, um die fehlende Konf iguration zu laden oder 
35 ggf. auch ein Fehlerstatus an die Konf igurationseinheit zu melden. 

Eine weitere wesentliche Funktion des Konf igurat ions stacks nach Figur 14 ist 
das Sequenzen Ober Konf igurat ionen, was bedingte und unbedingte Sprttnge 
innerhalb des Speichers 1401 bedeutet. Daher ist auch diese Funktion 
40 detailliert in Figur 14b beschrieben. 

Ein Befehlsdekoder (1462) erkennt bedingte und unbedingte Sprungbef ehle in 
Konfigurationsworten (1402) beim Lesen aus dem Speicher 1401. Einem 
Sprungbefehl ist als Konstante die relative Sprungadresse zur aktuellen 
45 Position zugeordnet, die vom Befehlsdekoder dekodiert und ausgegeben wird 
(1463). Je nach Sprungrichtung ist der Wert positiv oder negativ. 
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Weiterhin ist als Konstante ein Vergleichswert (1469) mit den eintreff enden 
Triggem oder den Statusf lags der PAE, beispielsweise die ALU-Flags zero, 
carry, negative, overflow, etc. oder die Speicher-Flags full, empty, etc., 
angegeben, in Abhangigkeit dessen bedingte Sprttnge durchgefuhrt werden. Diese 
5 wird an eine Vergleichseinheit 1464 tibermittelt, die den Wert mit den Flags 
(1465) und/oder Triggem, die von dem Augang ttbersetzungs- und 
Zuweisungseinrichtung (1437) und/oder direkt von dem Bussystem 0105 stammen, 
verglichen . 

10 Eine Steuereinheit (1466) generiert in Abhangigkeit des Befehles (bedingter 
oder unbedingter Sprung = "Type") und des Vergleichsergebnisses die 
Ansteuerung fur den Lesezeiger (1405) wie folgt: 

Unbedingter Sprung: Generiere "Set", urn neue Adresse nach 1405 zu laden; 
Bedingter Sprung, Vergleich erfullfc: Generiere "Set", urn neue Adresse nach 
15 1405 zu laden; 

Bedingter Sprung, Vergleich nicht erfullt: Generiere "Count- , urn Adresse des 
nachfolgenden Befehles in 1405 zu berechnen. 

Das Setzen einer neuen Adresse geschieht durch Aufaddieren. (1468) der 
20 relativen Sprungadresse (1463) zum aktuellen Wert von 1405. tiber einen 

Multiplexer (1467), der zwischen der aufaddierten neuen Adresse und der von 
14i5 generierten Startadresse von Konf igurationen (1461) auswahlt, wird die 
neue Adress bei Anliegen von "Set" in den Lesepointer 1405 geschrieben. 

25 Die Arbeitsweise des Konf igurat ions tacks macht die Verwendung von 

Konf igurationseinheiten (CT) wie aus PACT10 und PACT 17 bekannt weitgehend 
oboslet, vielmehr ist eine verteilte, parallele CT durch die 
Konf igurat ions stacks entstanden. 

Zwei Aufgaben der CT kSnnen dabei jedoch bei einer solchen Einheit 
30 verbleiben: 

1. Das Laden der Konf igurationen aus einem Speicher, der chipintern oder 
-extern implementiert sein kann, als flttchtiger oder nicht flttchtiger 
(ROM, EPROM, EEPROM, Flash-ROM, etc) Speicher ausgestaltet sein kann 

35 und/oder ein Massenspeicher sein kann. Dies kann nunmehr durch einen 

einfachen Mikrokontr oiler erfolgen, der Daten an die PAEs sendet und 
auf die zurttckgemeldete Quittierung reagiert. Beispielsweise kann 
bevorzugt die Einheit aus PACT05 als Mikrokontroller bzw. der in 
PACT 05 beschriebene Algorithms eingesetzt werden. Das Laden muS nicht 

40 mehr zwingend aktiv geschehen, sondem es ist ausreichend, wenn eine 

Einheit vorhanden ist, die auf das Konf igurat ion sanf or derungskommando 
das Hereinholen der neuen Konf igurationsdaten in die jeweilige PAE 
bzw. deren zugeordneten Konf igurat ions speicher veranlasst. Dies kann, 
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etwa bei den vorstehend diskutierten I/O-PAEs auch jene PAE selbst 
sein, die derzeit neue Konf igurat ionsda ten benOtigt. 

2. Die verbleibende Resteinheit kann verwendet werden, um 

sicherzustellen, dass Rekonfigurat ions trigger (WCT) in einer 
bestimmten Reihenfolge sortiert durch das Array laufen und/oder 
vorgeladene Konf igurationen in der erf orderlichen Reihenfolge 
abgearbeitet werden und/oder noch nicht geladene, aber benStigte 
Konf igurationen wie erforderlich angefordert und /oder geladen werden. 
Diese Rekonfigurationstriggerpriorisierung kann dazu verwendet werden, 
zu Priorisieren, auf welchen Rekonf igurat ions anforderungs trigger 
zuerst reagiert werden soil. Dies stellt die konf liktf reie Abarbeitung 
unterschiedlicher, mOglicher Konf igurationen sicher, indera lediglich 
festgelegt wird, welcher Trigger zunachst durch das Array lauft. Wenn 
ein solcher Trigger eine bestimmte PAE betrif ft, die auf diesen 
Trigger reagieren soli, wird sie sich dies merken, um dann als 
nachstes auf diesen Trigger reagieren zu kOnnen, sobald sie 
rekonf iguierbar ist. Es sei erwahnt, dass bevprzugt "die einzelne Zelle 
oder ein Zellgebilde oder dergl . nicht nur jene Trigger vormerkt, die 
unmittelbar nachfolgend abzuarbeitende Konf igurationen betref fen, 
sondern dass auch alle weiteren oder wenigstens mehrere, von dieser 
Zelle kunftig abzuarbeitenden Konf igurationen in ihrer Reihenfolge 
abgelegt werden konnen und/oder sollen, so dass jede Zelle oder 
Zellgruppe die Information aus den Triggervektoren erhalt und behalt, 
die sie zukunftig und/oder aktuell betrifft. Damit wird die Filmo- 
Funktion der fruheren CT Uberf lttssig und durch den Zeitverlauf der 
Triggervektoren im wesentlichen ersetzt. 

3. Sofern nur ein Rekonf igurat ions trigger verwendet wird, sind keine 
besonderen MaSnahmen erforderlich. Wenn mehrere 

Rekonfigurationstrigger (WCT) auftreten kttnnen, mUssen diese ohne 
zeitliche tJberlagerung, also nacheinander in fester Reihenfolge und 
kreuzungsfrei durch das Array laufen, um Deadlocks zu verhindern. 

Die kann durch das in Figur 16 dargestellte Verfahren sichergestellt werden, 
bei welchen durch Routing-MaSnahmen ftlr eine korrekte zeitliche Weiterleitung 
von WCT zu sorgen. Von einer zentralen Instanz (1603) werden mehrere WCT fur 
verschiedene PAEs (1601) generiert, die jedoch zeitlich aufeinander 
abgestimmt sein sollen. Die unterschiedlichen Entfernungen der 1601 in der 
Matrix fuhren zu unterschiedlichen Laufzeiten, bzw. Latenzzeiten. Dies wird 
in dem vorliegenden Beispiel durch das geeignete Einsetzen von Pipelinestuf en 
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(1602) durch den, dem Compiler zugeordneten Router, erreicht (vgl. PACT13) . 
Die sich dadurch ergebenden Latenzen sind mit dl-d5 angegeben. Es ist 
ersichtlich, dafi in Richtung des WCT-Flusses (1604) in jeder Stufe (Spalte) 
dieselben Latenzen auftreten. Beispielsweise ware 1605 nicht notwendig, da 
die Entfernung von 1606 von 1603 sehr gering ist. Da aber fur 1607 und 1608 
je ein 1602 aufgrund der durch die ISngere Distanz entstehenden Laufzeit 
eingefugt werden rauE, wird 1605 zum Abgleioh der Laufzeit notwendig. 
Die zentrale Instanz 1603 nimmt von den PAEs eingehende 

Rekonfigurationstrigger (1609) auf und priorisiert diese, urn sie dann jeweils 
einzeln und nacheinander als WCT an das Array aus PAEs zu senden. Mit 
anderen Worten sendet eine PAE, die einen Rekonfigurationstrigger generxert, 
diesen nicht direkt an andere PAEs weiter, sondern ausschlieSlich an die 
zentrale Instanz 1603. 

Die zentrale Instanz speichert eingehende Trigger und priorisiert diese. Dazu 
kann bevorzugt das aus PACT10 bekannt Verfahren des SCRR-ARB verwendet 
werden, wie es in Figur 8 PACT10 ausftihrlich beschrieben ist. 
Samtliche erwahnten PACT-Schutzrechte sind zu Of f enbarungszwecken 
vollumf Snglich eingegliedert . 
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Titel: 

Patentanspruche 



1. zellementefeld zur Datenverarbeitung mit Funktionszellen zur AusfOhrung 
algebraischer und/oder logischer Funktionen und Speicherzellen, urn 
Information zu empfangen, abzuspeichem und/oder auszugeben, dadurch 

10 gekennzeichnet, daS von den Funktionszellen eine steuerverbindung zu den 

Speicherzellen geftihrt ist. 

2. Zellementefeld nach dem vorbergehenden Anspruch, dadurch gekennzeichnet, 
daS ein Prozessor, Coprozessor und/oder Microcontroller mit einer 

15 Vielzahl in Funktion und/oder Vernetzung rekonf igurierbarer und/oder 

vorgebbarer Einheiten wie Funktionszellen und/oder Speicherzellen bildet. 

3. Zellementefeld nach einem der vorhergehenden Anspruche, dadurch 
gekennzeichnet, daS die Funktionszellen als arithmetische Logikeinheiten 

20 gebildet sind. 

4. Zellementefeld nach dem vorhergehenden Anspruch, dadurch gekennzeichnet, 
daS die arithmetischen Logikeinheiten als erweiterte ALUs gebildet sind. 

25 5. Zellementefeld nach einem der vorhergehenden Anspruche, dadurch 

gekennzeichnet, dafi die Speicherzellen zur fluchtigen und/oder nicht 
flttchtigen Datenspeicherung ausgebildet sind. 

6. Zellementefeld nach einem der vorhergehenden Anspruche, dadurch 
30 gekennzeichnet, da£ die Speicherzellen zur Abspeicherung von zu 

verarbeitenden Daten und/oder von zu verarbeitenden Programmschritten 
... ausgebildet sind. 

7. Zellementefeld zur Datenverarbeitung, dadurch gekennzeichnet, daS die 
35 speicherzellen dazu ausgebildet sind, abgespeicherte Inf ormationen auf 

Ansteuerung der sie steuernden Funktionszelle direkt und/oder indirekt 
auf einen zur Funktionszelle fuhrenden Bus zu geben. 

8. Zellementefeld nach einem der vorhergehenden Anspruche, worin zumindest 
40 einer Speicherzelle und/oder Funktionszelle Register zugeordnet sind, 

insbesondere ein Backward-Register, welches im Inf ormationsweg zwischen 
Speicherzelle und Funktionszelle angeordnet ist. 

9. Zellementefeld nach einem der vorhergehenden Anspruche, dadurch 

45 gekennzeichnet, dafc die Speicherzelle dazu angeordnet ist, Inf ormationen 

von der sie steuernden Funktionszelle, einer Eingabe-Ausgabe-Zelle 
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und/oder einer sie nicht steuemden Zelle mit arithmetischer Logikeinheit 
zu empfangen . 

10. Zellementefeld naclx einem der vorhergehenden AnsprUche, dadurch 
gekennzeichnet, dafi der Funktionszellen-Speicherzellen-Kombination 
zumindest ein Ein-Ausgabe-Mittel zugeordnet ist, urn Informationen an eine 
externe Einheit und/oder eine andere Funktionszelle. Funktionszellen- 
Speicherzellen-Kombination und/oder Speicherzelle zu senden und/oder von 
dieser zu empfangen. 

11. Zellementefeld nach dem vorhergehenden Anspruch. dadurch gekennzeichnet, 
daB das Ein-Ausgabe-Mittel gleichfalls zum Empfang von Steuerbefehlen 
aus der Funktionszelle ausgebildet ist. 

15 12 . zellementefeld nach einem der vorhergehenden AnsprUche, dadurch 

. gekennzeichnet, daB die Steuerung dazu ausgebildet ist, zumindest 

einige, bevorzugt alle der nachf olgenden Befehle zu Ubertragen und/oder 
die Speicherzelle bzw. Eingabe/Ausgabe-Zelle dazu ausgebildet ist, die 
f olgenden Befehle zu dekodieren: DATA WRITE/READ, ADRES S PO INTER 

20 WRITE / READ , PROGRAMMPOINTER WRITE/READ, PROGRAMMPOINTER INCREMENT, 

STACKPOINTER WRITE / READ , vorgenannte Befehle jeweils insbesondere fur 
intemen und/oder externen Zugriff, PUSH, POP, OPCODE, FETCH. 

13. zellementefeld nach einem der vorhergehenden Ansprtlche, dadurch 
gekennzeichnet, dafi die Funktionszelle als alleiniger Master auf die 
Steuerverbindung und/oder das als steuerungsverbindung dienende 
Bussegment zugreifen kann. 

14. Zellementefeld zur Datenverarbeitung nach einem der vorhergehenden 
AnsprUche, dadurch gekennzeichnet, daB die Funktionszelle zumindest 
einer von Speicherzelle und Ein-Ausgabezelle benachbart angeordnet ist. 

15. zellementefeld nach einem der vorhergehenden AnsprUche, dadurch 
gekennzeichnet, daB die Zellelemente multidimensional angeordnet sind, 
insbesondere matrixartig, wobei die Funktionszelle und/oder die 
benachbarte Speicher- bzw. Ein-Ausgabezelle aus einer oberen Reihe Daten 
empfangen und in eine untere Reihe Daten ausgeben kann, wobei in einer 
Reihe Busse vorgesehen sind und die Funktionszelle und zumindest eine 
Speicher- und/oder Ein-Ausgabezelle in ein und derselben Reihe liegen. 

16 Verfahren zum Betrieb eines Zellelementef eldes, insbesondere 

multidimensional^ Zellelementef eldes mit Funktionszellen zur AusfUhrung 
algebraischer und/oder logischer Funktionen und 

informationsbereitstellungszellen, insbesondere Speicherzellen und/oder 
45 Ein-Ausgabezellen zum Empfangen und/oder Ausgeben von Informationen 

und/oder Speichern derselben, dadurch gekennzeichnet, dafi zumindest eine 
der Funktionszellen Steuerbefehle an zumindest eine 
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Informationsbereitstellungszelle ausgibt, dort im Ansprechen auf die 
Steuerbefehlinformation fur die Funktionszelle verarbeitet wird und die 
Funktionszelle dazu ausgebildet ist, eine weitere Datenverarbeitung im 
Ansprechen auf aus der Inf ormationsbereitstellungszelie bereitgestellte 
5 information durchzuf tthren, urn so sequenzerartig Daten zu verarbeiten. 

17. verfahren nach einem der vorhergehenden Anspruche, dadurch 

gekennzeichnet, dafi die Funktionszelle dazu ausgebildet ist, zumindest 
einige der Steuerbef ehle 
10 OPCODE FETCH, 

DATA WRITE INTERN, 
DATA WRITE EXTERN, 
DATA READ INTERN, 
DATA READ EXTERN, 
15 ADRESS POINTER WRITE INTERN, 

ADRES SPO INTER WRITE EXTERN, 
ADRESS POINTER READ INTERN, 
ADRES SPO INTER READ EXTERN, 
PROGRAMMPOINTER WRITE INTERN, 
20 PROGRAMMPOINTER WRITE EXTERN, 

PROGRAMMPOINTER READ INTERN, 
PROGRAMMPOINTER READ EXTERN, 
STACKPOINTER WRITE INTERN, 
STACKPOINTER WRITE EXTERN, 
25 STACKPOINTER READ INTERN, 

STACKPOINTER READ EXTERN, 
PUSH, 
POP, 

PROGRAMMPOINTER INCREMENT 
30 ausgibt und im Laufe Zellementbetriebs zumindest einige, insbesondere 

alle der oben genannten Steuerbef ehle wie erforderlich ausgibt. 

18. Datenverarbeitungsanordnung mit einem multidimensionalen 
35 Feld 

in Funktion und/oder Vernetzung konf igurierbarer Zellelemente und 
diesen zugeordneten Konf igurationsvorhaltemitteln zum lokalen 
Konf igurations-Vorhal ten, 

dadurch g e k e n n z e i c h n e t , daS 
40 die Konf igurationsvorhaltemittel dazu ausgebildet sind, 

zumindest einen Teil der vorgehal tenen Konf igurationen 
nichtfluchtig vorzuhalten. 

19. Datenverarbeitungsanordnung mit einem multidimensionalen 
45 Feld 

in Funktion und/oder Vernetzung konf igurierbarer Zellelemente und 
diesen zugeordneten Konf igurationsvorhaltemitteln zum lokalen 
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Kon f i gur a t i ons - Vorhal t en , 
dadurch gekennzeichnet, da£ 
die Konf igur a t ions vorhal temitt el dazu ausgebildet sind, 
alle vorgehaltenen Konf igurationen 
5 nichtf lilchtig vorzuhalten. 

20. Datenverarbeitungsanordnung nach einem der vorhergehenden 
Datenverarbeitungsanordnungsansprtiche, dadurch gekennzeichnet, dafi die 
Funktion grobgranular konf igurierbar ist. 

10 

21. Datenverarbeitungsanordnung nach einem der vorhergehenden 
DatenverarbeitungsanordnungsansprUche, dadurch gekennzeichnet, dafi die 
Vernetzung grobgranular konf igurierbar ist. 

15 22. Datenverarbeitungsanordnung nach einem der vorhergehenden 

Datenverarbeitungsanordnungsansprttche, dadurch gekennzeichnet, dafi als 
Zellelemente zumindest eines von ALUs, EAlUs, RAM-Zellen, I/O-Zellen, 
LogiblGcken vorgesehen sind. 

20 23. Datenverarbeitungsanordnung nach einem der vorhergehenden 

Dat'enverarbeitungsanordnungsansprttche, dadurch gekennzeichnet, daS jedem 
Zellelement ein eigenes Konf igurationsvorhalt emit t el zugeordnet ist. 

24. Datenverarbeitungsanordnung nach einem der vorhergehenden 

25 Datenverarbeitungsanordnungsansprttche, dadurch gekennzeichnet, daS die 

Konfigurationsvorhaltemittel dazu ausgebildet sind, eine Vielzahl von 
Konf igurationen vorzuhalten. 

25. Datenverarbeitungsanordnung nach einem der vorhergehenden 

30 Datenverarbeitungsanordnungsansprtiche, dadurch gekennzeichnet, daS 

mehrere fest vorgegebene nichtf Itichtige Konf igurationen im 
Konfigurationsvorhaltemittel vorgegeben sind. 
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26. Datenverarbeitungsanordnung nach einem der vorhergehenden 

Datenverarbeitungsanordnungsansprttche, dadurch gekennzeichnet, dafi die 
Anordnung dazu ausgebildet ist, eine wechselnde einer Vielzahl von 
vorgehaltenen Konf igurationen zu verwenden, insbesondere im Wege der 
Wave-Rekonf iguration oder des lokalen Sequencing. 

40 27. Datenverarbeitungsanordnung nach einem der vorhergehenden 

DatenverarbeitungsanordnungsansprUche, dadurch gekennzeichnet, daS bei 
einigen Zellen im Betrieb mit verander lichen Konf igurationen versehbare 
Konfigurationsvorhaltemittel vorgesehen sind. 

45 28. Datenverarbeitungsanordnung nach einem der vorhergehenden 

DatenverarbeitungsanordnungsansprUche, dadurch gekennzeichnet, daS als 
Konfigurationsvorhaltemittel zunmindest eines aus ROM, EPROM, EEPROM, 
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Flash-Speicher, Fuse-, Antifuse-programmierbare Speichermittel und/oder 
in insbesondere in oberen Lagen einer Siliziumstruktur f est vorgesehene 
Speichermittel gewahlt sind. 

5 29 . Verf ahren zur Hers tel lung einer dedizierten 

Datenverarbeitungsanordnung, dadurch gekennzeichnet, daS ein 
multidimensionales Feld mit in Funktion und/oder Vernetzung 
konfigurierbaren Zellelemente und diesen zugeordneten 
Konf igurationsvorhaltemitt ein zum lokalen Konfigurat ions -Vorhal ten 

10 vorgegeben wird, bestimmt wird, welche Konf igurationen in diesen 

vorzuhalten sind, und dann nichtf luchtige Konf igur at ions vorhalt emit tel 
so vorgesehen werden, daS sie zumindest einen Teil der vorgehaltenen 
Konf igurationen nichtf lttchtig vorhal ten. 

15 30. Verf ahren nach dem vorhergehenden Datenverarbeitungsanordnungsanspruch, 
dadurch gekennzeichnet, da£ von einem zur laufzeit rekonfigurierbaren 
multidimensionalen Feld ausgegangen wird. 

31. Verf ahren nach dem vorhergehenden Datenverarbeitungsanordnungsanspruch, 
20 dadurch gekennzeichnet, daS zunachst von einem zur 

lauf zeitrekonf igurierbaren multidimensionalen Feld- mit 
Rekonfigurationsbeschaltung ausgegangen wird und dann fur 
Rekonfiguration nichtbenatigte Felder weggelassen werden. 

32. Datenverarbeitungsanordnung, insbesondere nach einem der vorhergehenden 
25 AnsprUche, insbesondere Prozessor, mit einem Feld aus. zur Laufzeit in 

Funktion und/oder Vernetzung datenverabeitenden rekonf igurierbaren 
Zellen, denen Speicher und eine Sequenzersteuerung zugeordnet ist, 
dadurch gekennzeichnet, daS die Steuerung derart ausgebildet ist, daS 
sich ein vollstandiger und/oder limitierter Befehssatz ergibt. 
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33. Datenverarbeitungsanordnung, insbesondere nach einem der 

vorhergehenden AnsprUche, insbesondere Prozessor, mit einem Feld aus 
zur Laufzeit in Funktion und/oder Vernetzung datenverabeitenden 
rekonfigurierbaren Zellen, mit einer ALU oder anderen logischen 
Verknupfungsbeschaltung und dieser zugeordnetem, insbesondere 
integriertem Speicher, dadurch gekennzeichnet, daS der Speicher in 
einer anderen Halbleiter-Lage, insbesondere oberhalb der ALU oder 
anderen logischen Verknupfungsbeschaltung angeordnet ist. 



40 



34. Datenverarbeitungsanordnung, insbesondere nach einem der 

vorhergehenden AnsprUche, insbesondere Prozessor, mit einem Feld aus 
zur Laufzeit in Funktion und/oder Vernetzung datenverabeitenden 
rekonfigurierbaren Zellen, von denen einige Speicherzwecken dienen, 
45 dadurch gekennzeichnet, dafi diese Zellen dazu ausgebildet sind, eine 

MMU und/oder DMA - Funktion zu realisieren. 
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35. Datenverarbeitungsanordnung, insbesondere nach einem der 

vorhergehenden Ansprtlche, insbesondere Prozessor, mit einem Feld aus 
zur Laufzeit in Funktion und/ Oder Verne tzung datenverabeitenden 
5 rekonfigurierbaren Zellen, dadurch gekennzeichnet, daS wenigstens 

eine, bevorzugt zumindest einige, insbesondere bevorzugt nicht alle, 
Zellen eine Eingangs / Ausgangs funktion realisieren und bevorzugt 
zugleich eine ALU oder anderen logischen Verknttpfungsbeschaltung zur 
Datenverarbeitung und/oder -veranderung aufweisen, wobei insbesondere 
10 Mittel vorgesehen sind, urn jedem EinganGs- und/oder Ausgangskanal eine 

definierte Adresse zuzuordnen, und/oder wobei 
Senderidentifkationsmittel vorgesehen sind. 
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36. Datenverarbeitungsanordnung, insbesondere nach einem der 



vorhergehenden Anspruche, insbesondere Prozessor, mit einem Feld aus 
zur Lauf zeit in Funktion und/oder Vernetzung datenverabeitenden 
rekonfigurierbaren Zellen, dadurch gekennzeichnet, dafi zumindest 
einige, bevorzugt nicht alle, Zellen f eingranulare FPGA-Strukturen 
aufweisen, wahrend andere Zellen grobgranulare Strukturen aufweisen. 

20 

37. Datenverarbeitungsanordnung nach dem vorhergehenden Anspruch, wobei 
eine Konf igurationseinheit zur schnellen Rekon figuration der Zellen 
vorgesehen ist, dadurch gekennzeichnet, dafi die Konf igurationseinheit 
nur zur Konf iguration der grobgranularen und/oder der Nicht-FPGA- 

25 Zellen beschaltet ist. 

38. Datenverarbeitungsanordnung, insbesondere nach einem der 
vorhergehenden Anspriiche, insbesondere Prozessor, mit einem Feld aus 
zur Laufzeit in Funktion und/oder Vernetzung datenverabeitenden 

30 rekonfigurierbaren Zellen zur Verarbeitung von Daten mit einer hGheren 

Bitbreite, dadurch gekennzeichnet, dafi die Zellen dazu ausgebildet 
sind, wahlweise Daten mit einer haheren Bitbreite oder Daten mit 
geringerer Bitbreite zu verarbeiten, wobei dann mehrere Daten mit 
geringerer Bitbreite simultan verarbeitbar sind, insbesondere nach Art 

35 eines SIMD-Rechenwerkes . 

39. Datenverarbeitungsanordnung, insbesondere nach einem der 
vorhergehenden Anspruche, nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet, daS zur Zelle hin oder von dieser weg ftihrende Busse 

40 teilbar sind, insbesondere urn mehrere Datenstr©me mit geringerer 

Bitbreite als der in der Zelle maximal bearbeitbaren Bitbreite 
unabhangig weiterleiten und/oder empfangen zu konnen. 

40. Datenverarbeitungsanordnung, insbesondere nach einem der 

45 vorhergehenden Anspruche, nach dem vorhergehenden Anspruch, dadurch 

gekennzeichnet, dafi die Busverwaltung lokal in der Zelle erfolgt. 
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Datenverarbeitungsanordnung insbesondere nach einem der vorhergehenden 
Anspruche, dadurch gekennzeichnet, dafi einer PAE ein Speicher zur 
Sequenzerrealisierung zugeordnet ist und die Adressbusse als 
Teiladresbusse aufteilbar sind. 

Datenverarbeitungsanordnung insbesondere nach einem der vorhergehenden 
Ansprtlche, dadurch gekennzeichnet, daS einer PAE ein Speicher zur 
Seguenzerrealisierung zugeordnet ist und eine Anordnung vorgesehen 
ist, urn bei Zugriff auf eine Speicherstelle sowohl Inf ormationen 
betreffend die Adresse einer Speicherstelle filr den nachsten 
Speicherzugriff zu bestimroen als auch Daten und/oder Befehle zu 
ermitteln. 



15 



IS. (ept«=i*r 1001 



66 



Akte PACT31C - 1 / 1 8 - 



CO 



o 

T— 

o 



CD 
O 



CM 
-JO 



co 
I o 



CO 
JO 

5_ 



0104 



cvj 
o 

5. 



CO 
JO 

5_ 



0104 



CM 

L_[ o 

5_ 



5!J01D4yj 



0104 



0104 



0104 



CO 

o 



CM 
—I ° 

5. 



CM 

LJo 



CO 
_j o 

5_ 



0104 



CM 

HJo 



CM 
JO 



0104 



CO 

1—1 o 

5_ 



CO 

o 



CM 

o 

5_ 



CM 
O 

5. 



CM 
O 



CM 
O 



0104 



CO 

o 



CO 
o I , 



0104 



CM 

o LJ 



CM 
O LJ 



CM 

o 



CM 

O LJ 



0104 



CO 

o LJ 



o 



Akte PACT31C 



2/18 



01 



0^a1 



bT02 b 




CM 



1Q102c 



0 



T3 
CO 
O 



05a 



01 03b 



- 0201 ~i 



- 0202 - 



L- 0203 - 



0104 



0105b 0103c| N T 



as 

CO 

o 



CO 
CM 

o> 
iZ 

0103a1 



0102a1 



10102 b 




0105a 



0103b 



■o 

CO 

o 



= 0201 n 



= 0202 



0203 



0104 



CO 

o 



0105b 0103c! N T 



CM 

iZ 

0103a1 



0102|a1 



5 



10102b 




0105a 



, 0103b 



T3 
CO 
O 



= 0201 n 



= 0202 



!= 0203 



01Q2x______|^bj0103O| Q1 03a1 



CO 
CO 

o 



O 
CM 

6) 

iZ 



0104 



Akle PACT31C 



-4/18- 



Q 



DC 
LLI 
O 
O 

DC 



"3- 

o 
o 



< 

Q 



LO 

o 




iiii-J'~ 0406 V 



DC 
UJ 

(D 
CD 

DC 
I- 



-eeeeeee© 



<H ) l I I I 



0405 



CO 

o 
o 



■ oodooooo 



- oooooooo 



oooooooo 



oooooooo 



O 
O 



CM 
O 

O 



- oooooooo 



- oooooooo 



»> oooooooo 



► oooooooo 



oooooooo 



- oooooooo 



■ oooooooo 



- oooooooo 



.a 

LO 

o 



iZ 



0408 

T 



o 
o 



Akle PACT31C 



8/18- 




0701 



AktePACT31c 



-10/18- 




Akte PACT31C 



11/18- 



— X3 
A II t- 



-cq- 



06 



1102 



A II t— 

-cq- 



06 



o3 



— X 

A 


: 

II -r- 












t £ 1102s ^ 
\ 



CMC^CMCVIOJCNI 



i i i i i 1 

f— T— T— T— T—l 



CO 
CO 

o 

00 

J o 

co 

u. 0 



\ 



Aii 



% <2 = 



\ 



O 

00 
o 



/ 



o 

ULI 







1102 




1q 




?1 1 32 z 


!o 






2: 


LU 


LU 


/. LU 

_i 


L±J 








I 



o 

• MM 



CD 



1131 t- 



<M CICU 

o 00 



(0 



V 


T 




I T 




r t 
































X 










C 


"1- 









06 



dM 
c\J 



06 



o3 



II 
A 



.C 

• MM 

-Q 



CM 



4M 
CM 



66 



II 

A 



o3 



CM 
CM 



II 
A 



O 



1^1123 ^ 



Akte PACT21 



-13/18- 



i 


I u 




D404 






1304 


i 


1 ti 




3404 






1303 



o 

CO 



CM 



LO 
O 
CO 





m 
o 


I 


► 


in 
o 




► 


I ^ 


CO 






CO 




i 


1304 




1304 




1304 



in 
o 

CO 



1305 




1305 



LO 

o 

CO 





LO 




O 


— ■ 


CO 







AktePACT31c 



- 14/18 



1411 



1433 

141 ~| l Size Of Config 1 



Size Of Config n 

, i — 
14121 + 

SC( n+1) *- 



0 

± 



1413 && 



1412C 

SC2 



+ 

T 



1 433 
14111 



^1413 && 



Size Of Config 0 



1 433 1532 



SC1 



-H413&& 



1415 



1414 



1 42 2 Command Config n 
S C(n) - * 

1433 



•| ^.g ffCommand Config 1 
SC1 1 - — 



f423 & & 



1424" 



1 



1433 



11 423 , && 



1424 



■j ^.g gtcommand Confi g ° 

SCO - t 

1433 



HI 423 & & 



1424',' 



1461 lF 



1405 



1402 



1409 



1 



1404 



ISet 



1401 



1421 



-7^ 



FlusH 



1426 



1403 



1407 



1406 



1416 



CM 

o 

+ 










LL 


?& 




ii + 

LO 

o 


1404 









CO 


CM 


O 


o 


o 


O 


O 


o 



00 

o 



Akte PACT31C 



15/18- 



141 



141 



1141 
1 



■J l Size Of Config n 



5 



.1451 
T 



H Size Of Config 1 



J 451 
T 

•j l Size Of Config 0 | 

' 1414 



403 



1 



4^> 3 Command Config n 



•J Command Config 1 



-| 4$ 3 Command^Config 0 



1403 



1421 



c CO 



co 



LO 

co 



1439 



CO 



3 



OH 



36( 










T 






O 








-> 











I 



CO 

== 

Ll ll. 

! I 



00 
CO 



col 

CO 



o 



I 



1437 



00 
CO 



3, 

CO 1 
CO 



- — - )o 



I 



CO 
CO 

^fr- 



ee 



CM 
CO 



1431 



AktaPACT31c _ -16/18 



o 



CO CO 



CD 



1^ 




LO 


CO 




O 
















CM 
.O 



iZ 



Akte PACT31C - 17/ 18 




CD 
O 

LO 



O 

LO 





0803b 






0803a 







LO 

o 



LO 

■ MM 

Li. 



This Page is Inserted by IFW Indexing and Scanning 
Operations and is not part of the Official Record. 

BEST AVAILABLE IMAGES 

Defective images within this document are accurate representations of the original 
documents submitted by the applicant. 

Defects in the images include but are not limited to the items checked: 
□Tblack borders 

□ image cut off at top, bottom or sides 
faded text or drawing 

^ blurred or illegible text or drawing 

□ skewed/slanted images 

□ color or black and white photographs 

□ gray scale documents 

□ lines or marks on original document 

□ reference(s) or exhibit(s) submitted are poor quality 

□ OTHER: 

IMAGES ARE BEST AVAILABLE COPY. 
As rescanning these documents will not correct the image 
problems checked, please do not report these problems to 
the IFW Image Problem Mailbox. 



